|
【奥鹏】[南开大学]19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业
试卷总分:100 得分:100
第1题,Python中把集合转换为列表需要使用##函数
A、set
B、list
C、convert
D、change
正确答案:
第2题,下面Python代码输出为():
def default_para_without_trap(para=[], value=0):if not para:para = []para.append(value)return para
print('第一步:{}'.format(default_para_trap(value=100)))print('第二步:{}'.format(default_para_trap(value=50)))
A、第一步:[100]
第二步:[100,50]
B、第一步:[100]
第二步:[50]
C、第一步:[100]
第二步:[]
D、第一步:[100]
第二步:[100]
正确答案:
第3题,以下哪个HTML标签表示分区或节()
A、
B、
C、
D、
正确答案:
第4题,使用xpath方法的返回类型是()
A、列表
B、元组
C、字典
D、集合
正确答案:
第5题,以下哪个HTML标签表示定义 HTML 表格中的标准单元格()
A、
B、
C、
D、
正确答案:
第6题,当需要把Python里面的数据发送给网页时,需要先转换成()字符串
A、Python
B、Json
C、正则表达式
D、Ajax
正确答案:
第7题,以下哪个命令是利用URL语法在命令行下工作的文件传输工具()
A、curl
B、tar -zxvf
C、mkdir
D、cp
正确答案:
第8题,带上通过Chrome浏览器从评论页面复制而来的()再发起请求,可以减少爬虫被网站封锁的概率
A、Cookie
B、Html
C、Headers
D、CSS
正确答案:
第9题,Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()
A、列表
B、元组
C、字典
D、集合
正确答案:
第10题,PyMongo中逻辑查询表示不等于的符号是()
A、$gt
B、$lt
C、$eq$$ne
正确答案:
第11题,()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。
A、meta
B、head
C、header
D、body
正确答案:
第12题,使用Xpath构造相同字符串开头的路径采用()方法
A、starts-with
B、starts
C、begin
D、begin-with
正确答案:
第13题,Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为()
A、空
B、空列表
C、空元组
D、不返回
正确答案:
第14题,当需要把Python里面的数据发送给网页时,应先将其转换成()
A、Json字符串
B、GET
C、POST
D、Request
正确答案:
第15题,使用UI Automator获滚动屏幕的操作是得到相应控件后使用命令()
A、scroll
B、scroll_up
C、scroll_forword
D、scroll_back
正确答案:
第16题,Redis若要进入交互环境,需要打开终端输入()
A、redis-cli
B、redis
C、redis-cmd
D、redis-start
正确答案:
第17题,使用Xpath获取文本使用()
A、text
B、text()
C、content
D、content()
正确答案:
第18题,Python中Object={'obj_1':'1','obj_2':'2'},则Objcet是()
A、列表
B、元组
C、字典
D、集合
正确答案:
第19题,使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()
A、scroll_forwad
B、scroll_up
C、scroll.forward
D、scroll.vert.forward
正确答案:
第20题,xpath中extract方法返回值类型是()
A、列表
B、元组
C、字典
D、集合
正确答案:
第21题,Python中有哪些实现多线程方法()
A、multiprocess.dummy
B、threading.Thread
C、process
D、PyMongoDB
正确答案:,B
第22题,HTTP常用状态码表明表明浏览器需要执行某些特殊的处理以正确处理请求的有()
A、200
B、301
C、302
D、204
正确答案:,C
第23题,Python中的容器有()
A、列表
B、元组
C、字典
D、集合
正确答案:,B,C,D
第24题,Python中()容器有推导式
A、列表
B、元组
C、字典
D、集合
正确答案:,C,D
第25题,Python中一个函数可以有()个return语句
A、0
B、1
C、多个
D、2
正确答案:,B,C,D
第26题,使用BeautifulSoup对象后可以使用()来查找内容
A、find_all
B、find
C、search
D、search_all
正确答案:,B
第27题,在配置ios使用Charles的操作中,正确的有()
A、对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
B、选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888
C、输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
D、安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任
正确答案:,B,C,D
第28题,网络爬虫的用途有()
A、收集数据
B、尽职调查
C、提高流量
D、攻击服务器
正确答案:,B,C
第29题,HTTP常用状态码表明表明客户端是发生错误的原因所在的有()
A、403
B、404
C、500
D、503
正确答案:,B
第30题,HTTP常用状态码表明请求被正常处理的有()
A、200
B、301
C、302
D、204
正确答案:,D
第31题,异步加载的内容一般在网页框架加载完成之前
T、对
F、错
正确答案:F
第32题,当使用Scarpy创建爬虫时,当爬取网易云音乐首页信息时,scrapy genspider的第二个参数直接输入"163.com"就可以了
T、对
F、错
正确答案:F
第33题,要实现Charles对Android抓包,其过程比iOS稍微复杂一点。这是因为不同的Andorid设备,安装证书的入口可能不一样
T、对
F、错
正确答案:T
第34题,Python可以将列表或字典转换成Json字符串
T、对
F、错
正确答案:T
第35题,HTTP状态码302与307完全同义。
T、对
F、错
正确答案:T
第36题,Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;
T、对
F、错
正确答案:F
第37题,在默认情况下,Scrapyd可以从外网访问
T、对
F、错
正确答案:F
第38题,所有的异步加载都会向后台发送请求
T、对
F、错
正确答案:F
第39题,在使用多线程处理问题时,线程池设置越大越好
T、对
F、错
正确答案:F
第40题,Python中直接对浮点数进行计算有print(0.1+0.2),则结果为0.3
T、对
F、错
正确答案:F
第41题,上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。
T、对
F、错
正确答案:F
第42题,requests中get请求方法的使用为requests.get('网址', data=data)
T、对
F、错
正确答案:F
第43题,Python中写CSV文件的writerows方法参数为字典类型
T、对
F、错
正确答案:F
第44题,虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。
T、对
F、错
正确答案:T
第45题,Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。
T、对
F、错
正确答案:T
第46题,XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。
T、对
F、错
正确答案:F
第47题,插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1
T、对
F、错
正确答案:F
第48题,爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行
T、对
F、错
正确答案:F
第49题,mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本
T、对
F、错
正确答案:T
第50题,已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行
T、对
F、错
正确答案:F
|
|