티스토리 뷰

urllib.request Document

 

 

1. urllib.request.urlretrieve

1
2
3
4
5
6
7
8
9
10
11
import urllib.request as req
 
htmlUrl = "http://google.com"
 
savePath1 = "c:/workspace/image.png"
savePath2 = "c:/workspace/index.html"
 
req.urlretrieve(imgUrl, savePath1)
req.urlretrieve(htmlUrl, savePath2)
 
http://colorscripter.com/info#e" target="_blank" style="color:#e5e5e5text-decoration:none">Colored by Color Scripter
 

 

 

2. urllib.request.urlopen

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
import urllib.request as req
 
htmlUrl = "http://google.com"
 
savePath1 = "c:/workspace/image.png"
savePath2 = "c:/workspace/index.html"
 
#방법1
 
f1 = req.urlopen(imgUrl).read()
#print(type(f1))
#read() 함수로 바이너리로 읽어 옴
 
#바이너리로 읽어왔기 때문에 바이너리로 씀
saveFile1 = open(savePath1, "wb")
saveFile1.close()
 
 
#방법2
f2 = req.urlopen(htmlUrl).read()
with open(savePath2, "wb") as saveFile:
 
 
http://colorscripter.com/info#e" target="_blank" style="color:#e5e5e5text-decoration:none">Colored by Color Scripter
 

 

3. urlretrieve 와 urlopen의 차이

 - urlretrieve: 저장 > open("r") > 변수 할당 > 파싱 > 저장

    먼저 데이터를 메모리에 할당 하는 것이 아닌 바로  파일에 저장하기 때문에 파싱이 필요 없는 가공된 파일을 웹을 통해 다운받은 후 사요할 경우        용이하다.

 

- urlopen: 변수 할당 > 파싱 > 저장

    데이터를 웹에서 받아와 메모리에 할당한 후 파싱을 통해 데이터를 가공하여 파일에 저장하는 방식.

   가공되지 않은 raw data를 저장할때 유용한 방식.

 

 

728x90

'Python' 카테고리의 다른 글

[Python] Comma(,) 를 사용한 동시 할당  (0) 2021.05.15
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/11   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
글 보관함