본문 바로가기
React/Web

3. Python, pymongo, mongoDB

by imagineer_jinny 2021. 2. 28.

파이썬 패키지 설치:

 

File ->Setting ->Project->Python Interpreter -> + 누르기 -> 검색해서 쓰고 ->Install Package ->OK

패키지마다 쓰는 사용법 있는데 구글링해서 코드 복붙 후 사용하기

 

크롤링: 구글이나 네이버의 검색 엔진이 내 사이트를 퍼가는 행위

크롤링이 가능한 기본적인 이유?

이미 받아온 것을 가지고 솎아내는 것이 크롤링!

 

따라서 크롤링 할 때 중요한 두가지는

1) 코드단에서 요청하는 것(브라우저를 키지 않고)

2) 요청돼서 가지고 온 html들 중에 원하는 정보를 잘 솎아내는 것!

 

bs4에서 select와 select_one 사용법 알기!

 

태그 안의 텍스트를 찍고 싶을 땐 → 태그.text

태그 안의 속성을 찍고 싶을 땐 → 태그['속성']

 

ex) 크롤링 할때 쓰는 bs4

import requests
from bs4 import BeautifulSoup

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303',headers=headers)

soup = BeautifulSoup(data.text, 'html.parser')

 

 

DB개괄

 

데이터베이쓰는 왜 쓸까? 데이터를 잘 갖다쓰려고!

 

데이터베이스엔 크게 두가지 종류가 있음

 

1) RDBMS(SQL)

행/열의 생김새가 정해진 엑셀에 데이터를 저장하는 것과 유사함.

데이터 50만 개가 적재된 상태에서, 갑자기 중간에 열을 하나 더하기는 어렵다. 하지만 정형화되어 있는 만큼, 데이터의 일관성이나 / 분석에 용이할 수 있다.

ex) MS-SQL, My-SQL 등

 

2)No-SQL

딕셔너리 형태로 데이터를 저장해두는 DB.

따라서 데이터 하나 하나 마다 같은 값들을 가질 필요가 없음. 자유로운 형태의 데이터 적재에 유리한 대신, 일관성이 부족할 수 있다.

ex) MongoDB

 

MongoDB와 Robo3T?

 

MongoDB는 데이터베이스(데이터 쌓아두는 것). 그런데 내 눈에 보이지 않게 켜짐. 그래서 Robo3T를 가지고 MongoDB의 데이터를 눈으로 볼 수 있게 함!

Robo3T는 MongoDB의 데이터를 시각화해서 눈으로 볼 수 있게 하는 프로그램

 

pymongo로 DB조작하기

 

-pymongo 라이브러리의 역할

 

MS Excel를 파이썬으로 조작하려면, 특별한 라이브러리가 필요할 것임.

마찬가지로, mongoDB 라는 프로그램을 조작하려면, 특별한 라이브러리, pymongo가 필요!

 

-pymongo 사용법

 

 

 

'React > Web' 카테고리의 다른 글

FlexBox 이해하기  (0) 2021.05.08
5. API 연습하기  (0) 2021.03.02
4. Flask, API 만들기  (0) 2021.03.02
2. JQuery, Ajax, API  (0) 2021.02.27
1. 웹의 동작 개념 / HTML, CSS, Javascript  (0) 2021.02.25

댓글