반응형
목록크롤링이란? (1)
반응형
보안세상
네이트 뉴스기사 크롤링 프로그램에 대해서 알아보자.(파이썬 코드 공개, 주석)
파이썬이란 컴퓨터 언어 중 하나로 웹페이지나 파일 등을 수집하거나 데이터를 추출하는데 유용하게 쓰이는 프로그래밍 언어입니다. 최근엔 머신러닝과 딥러닝 분야에서도 많이 활용되고 있죠. 이러한 파이썬을 이용해서 우리나라 사람들이 자주 방문하는 사이트들을 크롤링 해볼건데요~ 지금부터 저와 함께 차근차근 배워보도록 하겠습니다. 크롤링(Crawling) 이란 뭔가요? 크롤링이라는 단어 자체는 ‘긁어모으다’라는 뜻이지만, 실제로는 웹 페이지 내의 정보를 긁어오는 작업을 의미합니다. 예를 들어 네이버 뉴스 기사 제목 밑에 나오는 댓글 목록을 가져오는 경우라고 하면, 해당 기사의 URL 주소를 복사 한 후 붙여넣기 하여 원하는 내용을 가져오면 됩니다. 이 때 특정 키워드를 입력하면 관련된 다른 글 들도 가져올 수 있고..
내 생각
2023. 8. 10. 09:56