+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

python网络爬虫学习笔记(2)

发布于2019-09-11 14:16     阅读(149)     评论(0)     点赞(1)     收藏(5)


网络爬虫学习笔记(2)

1 资料

  • 《Python网络爬虫从入门到实践》唐松,陈志铨。主要面向windows平台下的python3。
  • 菜鸟教程-》python

2 笔记

2-1 Python基础(1)++

  1. python的列表还有一种只读格式——元组Tuple,它用()进行赋值,且只能在初始化时赋值。
  2. 列表有追加元素的内置方法append()
  3. 字典有内置方法keys()(获得所有键的值),values()
  4. 元组用 “( )” 标识, 列表用 “[ ]” 标识,字典用 “{ }” 标识
  5. type(变量) 查看该变量的数据类型,还可以用 isinstance(变量,类型) 来判断是不是那种类型。type()不会认为子类是一种父类类型,isinstance()会认为子类是一种父类类型。

2-2 Python基础(2)

  1. 条件语句——格式上是if 条件 :,取代Java中()的是一个在最后的:同样有else存在(但是else后面要加:),另外还有else if简写而成的elif。
a = 'book'
b = 'java'
c = "book"
if a == b :
    print(a)
else :
    print('a!=b')
if a == c :
    print(a)
elif b == c :
    print('b==c')
else :
    print('c!=a/b')
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  1. 循环语句——常用的有for循环和while循环两种,同样是()变成末尾的:。不过python的for循环形式上更接近foreach循环,python中的循环还可以使用else。
myBook = ['java', 'python', 'c']
for book in myBook:
    print(book)
print('\n')
for i,j in enumerate(('a','b','c')):
    print (i,j)
for i,j in enumerate(myBook):
    print (i,j)
count = 0
while count < 3:
    print(myBook[count])
    count = count + 1
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12

for循环中利用内置函数 len() 和 range(),函数 len() 返回列表的长度,即元素的个数, range返回一个序列的数。(例子来自菜鸟)(菜鸟你的括号呢?)

fruits = ['banana', 'apple',  'mango']
for index in range(len(fruits)):
   print ('当前水果 :', fruits[index])
  • 1
  • 2
  • 3

else使用例子(例子来自菜鸟)

for num in range(10,20):  # 迭代 10 到 20 之间的数字
   for i in range(2,num): # 根据因子迭代
      if num%i == 0:      # 确定第一个因子
         j=num/i          # 计算第二个因子
         print ('%d 等于 %d * %d' % (num,i,j))
         break            # 跳出当前循环
   else:                  # 循环的 else 部分,不break跳出循环的话就会执行
      print (num, '是一个质数')
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

此外循环中可以用continue、break、pass(什么也不做)。
3. 函数——参数(()里的内容)必须要正确地写入函数中

def add(x):
    y = x + 1
    return y
w = 1
print(w)
print(add(w))
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  1. 运算符,这里只提一下python中有**——幂 - 返回x的y次幂,//——取整除 - 返回商的整数部分(向下取整)并且没有++、–(- -,间隙被间隙掉了!)。另外与或非分别写成and、or、not。python还有成员运算符in、not in;身份运算符is,not is(用于比较两个对象的存储单元)
class Person:
    #这是一个类变量,它的值将在这个类的所有实例之间共享
    n = 0 
    #__init__构造方法,注意前后均有两个_
    #self 代表类的实例,self 在定义类的方法时是必须有的
    #,虽然在调用时不必传入相应的参数。
    def __init__(self, name, age): 
        self.name = name
        self.age = age
    def detail(self): #通过这个函数来调用被封装的内容
        print(self.name)
        print(self.age)
        
obj1 = Person('sss', 16)#对象声明
obj1.detail() 
obj1.name
obj1.n
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

继承格式

class 子类名(父类名):
  • 1

构造方法重写时用super关键字来使用父类构造方法

class Father(object):
    def __init__(self, name):
class Son(Father):
    def __init__(self, name):
    super(Son, self).__init__(name)
  • 1
  • 2
  • 3
  • 4
  • 5
    1. 基础重载方法
      下表列出了一些通用的功能,可以在自己的类重写:
__init__ ( self [,args...] )
构造函数
简单的调用方法: obj = className(args)
__del__( self )
析构方法, 删除一个对象
简单的调用方法 : del obj
__repr__( self )
转化为供解释器读取的形式
简单的调用方法 : repr(obj)
__str__( self )
用于将值转化为适于人阅读的形式
简单的调用方法 : str(obj)
__cmp__ ( self, x )
对象比较
简单的调用方法 : cmp(obj, x)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  1. 模块Module——是一个 Python 文件,以 .py 结尾,包含了 Python 对象定义和Python语句。使用 import 语句来引入模块。
# 导入模块
import support 
# 现在可以调用模块里包含的函数了
support.print_func("Runoob")
  • 1
  • 2
  • 3
  • 4


所属网站分类: 技术文章 > python文章

作者:gg

链接: http://www.pythonheidong.com/blog/article/107250/

来源:python黑洞网 www.pythonheidong.com

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

1 0

赞一赞 or 踩一踩

收藏该文
已收藏

评论内容:(最多支持255个字符)

相似文章

  用python写网络爬虫 pdf下载高清

  Python3.2.3官方文档(中文版)pdf下载

  Python网络爬虫实战 爬虫视频教程下载

  Head First Python(中文版)pdf下载

  Python学习手册(第4版) pdf下载

  简明python教程 (A Byte of Python)pdf下载

  python面试题之常用的反爬虫措施?

  python面试题之常见的反爬虫的应对方法

  python面试题37道(附答案)看完面试不愁了

  python常见面试题15道 (附答案)

优质资源排行榜

 python经典电子书大合集下载 下载次数 8104

 零基础java开发工程师视频教程全套,基础+进阶+项目实战(152G) 下载次数 7543

 零基础前端开发工程师视频教程全套,基础+进阶+项目实战(共120G) 下载次数 7438

 零基础大数据全套视频400G 下载次数 7001

 零基础php开发工程师视频教程全套,基础+进阶+项目实战(80G) 下载次数 6891

 零基础软件测试全套系统教程 下载次数 6501

 全套人工智能视频+pdf 下载次数 6436

 IOS全套视频教程 基础班+就业班 下载次数 4679

 编程小白的第一本python入门书(高清版)PDF下载 下载次数 3076

10  effective python编写高质量Python代码的59个有效方法 pdf下载 下载次数 3047

11  Python深度学习 pdf下载 下载次数 3035

12  使用python+pygame开发的小游戏《嗷大喵快跑》源码下载 下载次数 2998

13  python项目开发视频 下载次数 2996

14  python从入门到精通视频(全60集)python视频教程下载 下载次数 2993

15  黑马2017年java就业班全套视频教程 下载次数 2992

16  python实战项目 平铺图像板系统源码下载,适用于想要保存,标记和共享图像,视频和网页的用户 下载次数 2987

17  利用python实现程序内存监控脚本 下载次数 2986

18  老男孩python自动化视频 下载次数 2979

19  树莓派Python编程指南 pdf下载 下载次数 2976

20  尚硅谷Go学科全套视频 下载次数 2972

21  老王python基础+进阶+项目视频教程 下载次数 2971

22  某硅谷Python项目+AI课程+核心基础视频教程 下载次数 2966

23  Web前端实战精品课程 下载次数 2966

24  Python基础教程 pdf下载 下载次数 2962

25  tron python小游戏 下载次数 2962

26  [小甲鱼]零基础入门学习Python 下载次数 2959

27  老男孩python全栈开发15期 下载次数 2958

28  2017最新web前端开发完整视频教程附源码 下载次数 2948

29  最新全套完整JAVAWEB2018开发视频 下载次数 2926

30  Python算法教程_中文版 pdf下载 下载次数 2910

31  Spring boot实战视频6套下载 下载次数 2909

32  python全套视频十五期(116G) 下载次数 2901

33  Python项目实战 下载次数 2882

34  python全自动抢火车票教程-python视频教程下载 下载次数 2882

35  30个小时搞定Python网络爬虫 含源码 下载次数 2881

36  尚硅谷大数据之Hadoop视频 下载次数 2876

37  简明python教程 (A Byte of Python)pdf下载 下载次数 2870

38  Python A~B~C~ python视频教程下载 下载次数 2864

39  数据结构与算法视频(小甲鱼讲解-全) 下载次数 2863

40  web小程序表白天数倒计时源码下载 下载次数 2862

41  python基础视频教程 下载次数 2862

42  Python高性能编程 pdf下载 下载次数 2858

43  Python Cookbook第三版中文PDF下载高清完整扫描原版 下载次数 2856

44  go语言全套视频 下载次数 2852

45  清华学霸尹成Python爬虫视频-ok 下载次数 2845

46  黑马前端36期最全视频和代码 下载次数 2841

47  2018最新全套web前端视频教程+源码下载 下载次数 2839

48  利用Python进行数据分析 pdf下载 下载次数 2834

49  老男孩Python自动化开发12期 老男孩最强一期python高级运维开发课程 第二部分 70GB 下载次数 2832

50  python视频 神经网络 Tensorflow 下载次数 2827