转载自:http://blog.csdn.net/sding/archive/2011/02/28/6214207.aspx
1.最基本的抓站
import urllib2
content = urllib2.urlopen('http://XXXX').read()
-
2.使用代理服务器
这在某些情况下比较有用,比如IP被封了,或者比如IP访问的次数受到限制等等。
import urllib2
proxy_support = urllib2.Pro[......]
转载自:http://blog.csdn.net/sding/archive/2011/02/28/6214207.aspx
1.最基本的抓站
import urllib2
content = urllib2.urlopen('http://XXXX').read()
-
2.使用代理服务器
这在某些情况下比较有用,比如IP被封了,或者比如IP访问的次数受到限制等等。
import urllib2
proxy_support = urllib2.Pro[......]
本章主要介绍测试、调试和性能调优
1、C、Java等语言,都是预编译类型,编译器会阻止大部分的错误。而对于Python来说,仅当运行时才能知道错误。因此,发现错误的过程更麻烦一些。
2、函数、类等第一行常用三个引号的字符串来写注释docstring,如下:
def split(line,...):
"""
Split....
>>>split(...)
>>>[...]
"""
如上所示,doc中经常包含python交互shell的[......]
1、python解析器的参数:
-i 当程序执行完毕后,进入交互模式。
-O 优化模式
-OO 进一步优化模式
-v 详细现实
-x 跳过py文件的第一行
2、另外,python会解析一些环境变量,例如:
PYTHONPATH 模块搜索的路径,会被插入到 sys.path
PYTHONIOENCODING 对于stdin、stdout和stdout的方式?
PYTHONOPTIMIZE -O参数
3、当在命令行只输入python,不加任何py文件时,进入交互模式。&g[......]
本章主要是关于各种I/O操作,包括File-Objec及其操作、Unicode字符串相关的I/O函数以及对象的序列化和持久化。
1、从cmd读取传入参数:sys.argv。其中sys.argv[0]是当前的程序名称。
2、想要退出系统时,出了exit和return外,还可以raise SystemExit(1)
3、解析命令行参数,可以使用optparse模块。
不过从2.7之后,Python将废弃optparse,转而支持argparse,话说开源的东西变动太大。。。
o[......]
Debian5 (lenny)上安装的python是2.5的,很老,怎么安装2.7的呢?
除了编译之外,我们还可以用apt的方法搞定。如下:
1、修改源
实际上python2.7在unstable源中
sudo vim /etc/apt/sources.list
#添加
deb http://ftp.us.debian.org/debian/ unstable main contrib non-free
#更新
sudo apt-get update
2、安装
sud[......]