3주차 강의 완강!!
3주차 강의는 Python, 크롤링, mongoDB에 중점을 두고 있다.
@Python
- 파이썬이란?==> 일종의 번역팩을 설치한다라 생각하면 된다.
- 터미널은 텍스트로 명령어를 입력하면 결과를 텍스트로 화면에 출력해주는 도구
- 라이브러리를 설치하거나 프로젝트를 실행할 떄 사용한다.
- 매우 직관적인 언어이고, 할 수 있는게 많다.
- 중요한 부분은 모두 다 기억하기란 쉽지 않다. 필요한 부분을 찾아 적절하게 사용할 줄 알아야한다.
- 기초 문법(변수&기본연산, 자료형(숫자,문자형, 리스트형, 딕셔너리형), 함수, 조건문, 반복문)
- 가상환경 venv==> 같은 시스템에서 실행되는 다른 파이썬 응용 프로그램들의 동작에 영향을 주지 않기 위해, 파이썬 배포 패키지들을 설치하거나 업그레이드하는 것을 가능하게 하는 격리된 실행 환경이다.
- 새로운 프로젝트에 라이브러리를 설치할 떄 pip을 이용하여 설치한다.
@웹스크랩핑(크롤링)
- 웹에 있는 내용을 가져오는 작업
- 1. 원하는 부분==>검사> 원하는 태그> Copy> Copy selector로 선택자를 복사
@DB
- RDBMS(SQL)==>정형화되어 있다, 데이터의 일관성, 분석에 용이
- No-SQL==>딕셔너리 형태로 데이터 저장, 자유로운 형태의 데이터 적재, 일관성이 부족하다.
* 지니뮤직 1~50위 정리
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://www.genie.co.kr/chart/top200?ditc=M&rtm=N&ymd=20210701',headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
trs = soup.select('#body-content > div.newest-list > div > table > tbody > tr')
for tr in trs:
a = tr.select_one('td.info > a.title.ellipsis')
if a is not None:
title = tr.select_one('td.info > a.title.ellipsis').text.strip()
rank = tr.select_one('td.number').text[0:2].strip()
artist = tr.select_one('td.info > a.artist.ellipsis').text
print(rank, title, artist)
계속해서 복습을 통해 익숙해지는 과정이 나에게 있어서 제일 중요한 부분이라 생각된다.
'JavaScript Dev. > 웹개발 기초 정리' 카테고리의 다른 글
[스파르타 코딩클럽] 웹개발 5주차 개발일지 (0) | 2023.02.23 |
---|---|
[스파르타 코딩클럽] 웹개발 4주차 개발일지 (0) | 2023.02.21 |
[스파르타 코딩클럽] 웹개발 2주차 개발일지 (0) | 2023.02.17 |
[스파르타 코딩클럽] 웹개발 1주차 개발일지 (0) | 2023.02.16 |