Crawling

    [3] 웹 페이지 크롤링 하여 파일 내용 비교하여 Slack 메신저로 알람 보내기(Web Crawling)

    코드들은 github에 업로드되어있습니다. https://github.com/JaeYeongSong/Blog/tree/main/Crawling GitHub - JaeYeongSong/Blog Contribute to JaeYeongSong/Blog development by creating an account on GitHub. github.com 저번시간에는 원하는 태그만 크롤링 하는 방법에 대해 알아보았습니다. 이번에는 크롤링한 데이터를 가지고, 파일 안에 있는 내용을 비교하는 방법에 대해 알아보겠습니다. 오늘은 제 티스토리 블로그에 새로운 게시물이 업로드 되었다면, Slack 메신저로 알람을 보내는 걸 한 번 해보도록 하겠습니다. 제 티스토리 블로그에 게시물을 크롤링 해서 앞 전에 크롤링 했던 데이..

    [2] 웹 페이지 원하는 태그만 크롤링하기(Web Crawling)

    코드들은 github에 업로드되어있습니다. https://github.com/JaeYeongSong/Blog/tree/main/Crawling GitHub - JaeYeongSong/Blog Contribute to JaeYeongSong/Blog development by creating an account on GitHub. github.com 저번 시간에 이어서 크롤링 하는 방법에 대해 알아보도록 합시다. 오늘은 원하는 태그만 데이터를 가져오는 방법에 대해 알아봅시다. 음 근데 처음 보는 단어가 있을 겁니다. 태그(Tag)가 무엇일까요? 일단 우리가 알려고하는 태그가 무엇인지 알아야 하겠죠. 그럼 HTML에 대해 알아야 할 것 같습니다. HTML은 Hypertext Markup Language의 줄..

    [1] 웹 페이지 크롤링하기(Web Crawling)

    코드들은 github에 업로드되어있습니다. https://github.com/JaeYeongSong/Blog/tree/main/Crawling GitHub - JaeYeongSong/Blog Contribute to JaeYeongSong/Blog development by creating an account on GitHub. github.com 오늘은 새로운 분야에 들어가 보도록 하겠습니다. 오늘은 크롤링(Crawling)을 알아보도록 합시다. 먼저 크롤링이란 무엇일까요? 크롤링이란? '데이터를 수집하고 분류하는 것'입니다. 많은 사람들이 크롤링이랑 스크래핑이란 헷갈려합니다. 스크래핑은 '인터넷에서 존재하는 데이터를 컴퓨터 프로그램을 통하여 자동화된 방법으로 웹에서 데이터를 수집하는 작업'이라는 뜻이..