Meta Tag를 사용한 뉴스기사 제목, 요약문, 이미지가져오기
·
Data Science/Data Engineering
개요뉴스기사 URL을 input으로 넣으면 해당 URL에서 대표이미지, 기사 제목 등을 가져오는 모듈이 필요했다.예를 들자면 아래 사진처럼 카카오톡이나 슬랙 등에 url만 넣으면 자동으로 이미지와 링크로 연결되는 컨텐츠를 만들어주는것이다.코드구글링을 해보니 기사에는 meta tag라는것이 있었고, 이를 parsing하면 간단히 구현이 가능해보였다.Python의 requests와 BeautifulSoup, Pillow, io를 사용하여 구현하기로 마음을 먹었다.우선 header를 설정하여 주었고, requests와 Beutifulsoup으로 html을 parsing 해왔다.이후 find 함수를 통해 meta의 title, description, image_url, image를 가져왔고, 이를 dict 형태..