생각이 담아두는 곳

1. 전체적인 구도 본문

CS_Project/WebCrawler_Venture

1. 전체적인 구도

Chang_Tree 2020. 3. 23. 01:33

목표는 투자회사가 주어지면, 그 투자회사가 투자한 기업들의 리스트 생성 

기업들을 https://thevc.kr/ 에 검색, 엑셀에 사명, 제품/서비스명, 업종,        회사설립연도, 직전라운드, 일시, 총투자금액, 투자자리스트를 자동으로       만들어 내는 것이다.  

하나 어려운 문제가 투자자리스트는, 뉴스에 들어가 상단 문단을 긁어서 파싱해야한다. 

 


일주일동안 만들 것은 기업들 리스트가 있다고 가정하고, 위 사이트 검색을 통해 원하는 데이터들을 가져오는 웹크롤링 장치이다. 

 

동적웹이 많아, 셀레니움을 이용할 것 같다.

Comments