1.python里面%d表数字,%s表示字符串,%%表示一个%;
2.单引号内嵌套单引号需要转义字符/;单引号内嵌套双引号不需要嵌套;
双引号内嵌套双引号需要转义字符/;双引号内引用单引号不需要转义字符。
3.字符串编译的过程:gbk==>unicode==>utf16==>url解码
字符串解码顺序为:url解码==>utf16==>unicode==>gbk
4.可变数据类型:列表[],字典{},集合
不可变数据类型:整形int、字符串str‘’、元组()
5.list-[ ]
tuple-( )
dict、set、frozenset-{ }
6.read()读写整个文件 readline() 只读写一行 readlines() 都所有行到list
7.Python使用#用来注释 ,以缩进来划分语句块。 、
8.Python的序列类型包括列表、元组、字典,其中,字典是Pyhton中唯一的映射类型。
9.Python的数字类型包括数字、字符串、列表、元组、集合、字典。
10.b 二进制模式
r 只读,指针会放在文件的开头
rb 二进制只读,指针会放在文件的开头
r+ 读写,指针将会放在文件的开头
w 写入,~
wb 二进制写入~
w+ 读写~
wb+ 二进制读写~
a 追加~
ab 二进制追加~
a+ 读写~
ab+ 二进制读写~
11.复数不能比较大小,ASCll码中小写字母>大写字母>数字
12.Python时解释执行的语音,JAVA、objectC、C#是类C语言。
13.字典的键值必须是不可变类型。
14.dict()用于创建一个字典。
15.Python 可以同一行显示多条语句,方法是用分号 ; 分开.
15.以下划线开头的标识符是有特殊意义的。以单下划线开头 _foo 的代表不能直接访问的类属性,需通过类提供的接口进行访问,不能用 from xxx
import * 而导入。
16.字典中的数据是通过键存取的,而列表的数据是通过偏移存取的。列表是有序的对象集合,字典是无序的对象集合。
17.列表可以完成大多数集合类的数据结构实现。它支持字符,数字,字符串甚至可以包含列表(即嵌套)。
18.hex()——将一个整数转换成十六进制字符串。
oct()——将一个整数转换成八进制字符串。
19.is用于判断两个变量的引用对象是否为同一个(同一块内存空间);==用于判断两个变量的值是否相等。
20.Python的变量命名规则?
①变量名只能包含字母、数字和下划线。变量名可以字母或下划线开头,但不能以数字开头,例如,可将变量命名为message_1,但不能将其命名为1_message。
②变量名不能包含空格,但可使用下划线来分隔其中的单词。例如,变量名greeting_message可行,但变量名greeting message会引发错误。
③不要将Python关键字和函数名用作变量名,即不要使用Python保留用于特殊用途的单词,如print。
④
变量名应既简短又具有描述性。例如,name比n好,student_name比s_n好,name_length比length_of_persons_name好。
⑤慎用小写字母l和大写字母O,因给他们可能被人错看成数字1和0。
21.简述Python的深浅拷贝以及应用场景?
深浅拷贝用法来自copy模块。
导入模块:import copy
浅拷贝:copy.copy
深拷贝:copy.deepcopy
对于 数字 和 字符串 而言,赋值、浅拷贝和深拷贝无意义,因为其永远指向同一个内存地址。
浅拷贝指仅仅拷贝数据集合的第一层数据,深拷贝指拷贝数据集合的所有层。所以对于只有一层的数据集合来说深浅拷贝的意义是一样的,比如字符串,数字,还有仅仅一层的字典、列表、元祖等。
深拷贝的时候python将所有数据在内存中新建了一份,所以如果你修改新的模版的时候老模版不会变。
22.简述使用requests模块进行数据爬取的大致流程?
(1)指定url
(2)基于requests模块发起请求
(3)获取响应对象中的数据
(4)数据解析
(5)持久化存储