구글 colab과 vscode 연동하기
·
Data Science/Data Engineering
개요구글 코랩은 굉장히 가성비가 좋은 데이터분석툴이다.쥬피터와 비슷한 환경을 가지고 있어 사용하는데 어색하지 않으며, GPU를 무료로 빌려주어 딥러닝 학습에도 많이 사용한다.vscode와 연동하여, 굳이 코랩으로 사용하지 않고 vscode 환경에서 사용하는 방법을 소개하려한다.ngrok 설치https://dashboard.ngrok.com/get-started/setup외부에서 로컬에 접속할수 있게 해주는 터널링 프로그램OS에 맞게 설치 (꼭 해야하는지는 확인 못함)https://dashboard.ngrok.com/get-started/your-authtoken위의 경로에서 authtoken 생성 (유효 기간 8시간)Colab 설정구글 Drive와 Colab 연동하기from google.colab imp..
Meta Tag를 사용한 뉴스기사 제목, 요약문, 이미지가져오기
·
Data Science/Data Engineering
개요뉴스기사 URL을 input으로 넣으면 해당 URL에서 대표이미지, 기사 제목 등을 가져오는 모듈이 필요했다.예를 들자면 아래 사진처럼 카카오톡이나 슬랙 등에 url만 넣으면 자동으로 이미지와 링크로 연결되는 컨텐츠를 만들어주는것이다.코드구글링을 해보니 기사에는 meta tag라는것이 있었고, 이를 parsing하면 간단히 구현이 가능해보였다.Python의 requests와 BeautifulSoup, Pillow, io를 사용하여 구현하기로 마음을 먹었다.우선 header를 설정하여 주었고, requests와 Beutifulsoup으로 html을 parsing 해왔다.이후 find 함수를 통해 meta의 title, description, image_url, image를 가져왔고, 이를 dict 형태..
교차검증(Kfold)이란?
·
AI/Machine Learing
교차 검증 이란?과적합 : 모델이 학습 데이터에마 과도하게 최적화된 현상. 그로인해 일반화된 데이터에서는 예측 성능이 과하게 떨어지는 현상지난번 와인 맛 평가에서 훈련용 데이터의 Acc는 72.94, 테스트용 데이터는 Acc가 71.61%였는데, 누가 이결과가 정말 괜찮은 것인지 묻는다면?나에게 주어진 데이터에 적용한 모델의 성능을 정확히 표현하기 위해서도 유용하다train 데이터를 다시 나누어 validation 데이터로 사용함으로써 과적합을 막는 방법검증이 끝나면 다시 train데이터로 학습 한 뒤 test로 마지막 결과를 확인한다교차 검증 구현하기Simple Exampleimport numpy as npfrom sklearn.model_selection import KFoldX = np.array(..
업비트 크롤링 (Crawling)
·
Data Science/Data Engineering
업비트 크롤링개요2017년 11월쯤 부터 가상화폐의 투자가 인기몰이를 하여, 많은 사람들이 투자를 하였고 2017년 12월에는 자고 일어나면 모든 가상화폐들이 약 2배 이상 올랐던 적이 있었다.그 당시엔 가상화폐에 투자하지 않으면 바보라는 소리가 나올정도로 엄청난 투자효과를 가져왔었고, 결국엔 1 비트코인은 중형차 한대 가격까지 오르게 된다.하지만 2018년 1월쯤부터 가격은 폭락하기 시작, 많은 사람들이 엄청난 손해를 보게 되었으며, 그때부터 소위 '존버'라는 단어가 유행되기 시작했다.그 당시 많은 손해를 본 사람중 한명으로써 비트코인의 가격을 조금이라도 예측할 수 있었다면 (물론 힘들겠지만) 최소한 엄청난 손해는 보지 않았을 것으로 생각하였다.일단 데이터부터 있어야, 무언가를 예측해볼수 있을것으로 판..
Keybert와 kiwi형태소분석기를 사용하여 키워드추출 하기
·
AI/Natural Language Processing
들어가며# !pip install keybert# !pip install kiwipiepyKeyBert라는 키워드 추출 Bert 있어 간략히 소개 하려고 한다.KeyBert에 대한 자세한 내용은 https://maartengr.github.io/KeyBERT/ 참조데이터 소개from keybert import KeyBERTfrom kiwipiepy import Kiwifrom transformers import BertModeltext="""김영하가 『살인자의 기억법』 이후 9 년 만에 내놓는 장편소설 『작별인사』는 그리 멀지 않은 미래를 배경으로, 별안간 삶이 송두리째 뒤흔들린 한 소년의 여정을 좇는다. 유명한 IT 기업의 연구원인 아버지와 쾌적하고 평화롭게 살아가던 철이는 어느날 갑자기 수용소로 끌려..