본문 바로가기
반응형
반응형

프로그래밍/Python15

반응형
[AWS] AWS EC2 시작부터 jupyter notebook 설치 Ubuntu Server을 선택한다. 이 화면이 나오면 그대로 '검토 및 시작' 버튼을 클릭한다. 이 화면에서도 '시작하기' 버튼을 눌러 넘어간다. 키페어를 '새 키페어 생성'으로 바꾸고 파일이름을 설정한다. 나는 보시다시피 'good'으로 지었다. 그 후 키페어를 다운받은 후 '인스턴스 시작'을 누른다. (키페어는 중요하기 때문에 잘 보관하길 바람) 실행이 완료되면 이런 화면이 뜬다! 나는 인스턴스를 중지했기 때문에 '중지됨' 이지만 처음 시작하면 실행중 이라고 되있다. 여기까지 끝나면 아까 다운받았던 키페어 파일로 간다 (good.pem 이런식으로 저장되있음) 파일의 속성을 들어가자. 그 후 보안클릭 후 고급설정을 들어가면 이런 설정이 나오는데 Administrators 와 SYSTEM을 제외한 것들.. 2020. 9. 26.
[웹크롤링] 파이썬으로 삼성주식뉴스 가져오기 In [1]: import requests from bs4 import BeautifulSoup import pandas as pd result = [] jour = [] for page in range(10): raw = requests.get('https://search.naver.com/search.naver?&where=news&query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90' + str(page * 10 + 1), headers={'User-Agent': 'Mozilla/5.0'}).text html = BeautifulSoup(raw, 'html.parser') articles = html.select(&#3.. 2020. 9. 20.
[웹크롤링]네이버 주식뉴스 크롤링 시도 import requests from bs4 import BeautifulSoup url = 네이버 주소 html = requests.get(url) soup = BeatifulSoup(html.text , 'html.parser') content = soup.find_all('dd', {'class', 'articleSubject'}) for i in content: b = i.find_all('a')['href'] print(b) 네이버 주식뉴스 게시판에 requests 후 뷰숩으로 html을 간단히 만들었다.. 뉴스에 들어가서 데이터를 뽑아낼려고 했더니 주소에 못들어 간단다.. 뭐지 네이버에서 막아놓은건가? 딴곳을 찾으러 가야겠다.. 2020. 8. 14.
반응형