奥鹏答案网-奥鹏作业答案-奥鹏在线作业答案-奥鹏离线作业答案-奥鹏毕业论文-专业奥鹏作业答案辅导网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 163|回复: 0

南开19秋学期《并行程序设计》在线作业2(100分)

[复制链接]

2万

主题

2万

帖子

6万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
64471
发表于 2019-11-1 13:45:19 | 显示全部楼层 |阅读模式

【奥鹏】[南开大学]19秋学期(1709、1803、1809、1903、1909)《并行程序设计》在线作业
试卷总分:100    得分:100
第1题,采用多核、众核技术提升CPU性能,相对于单核的优势不包括____。
A、架构设计更容易
B、更易突破物理极限
C、能更充分利用现有资源
D、功耗优势明显
正确答案:


第2题,n个元素排序问题,如果只能通过元素比较交换构造算法,则n个处理器的并行排序算法达到____的运行时间才是代价最优的。
A、O(logn)
B、O(n)
C、O(nlogn)
D、O(n^2)
正确答案:


第3题,一个并行算法是非代价最优的,则____改进为代价最优。
A、减少处理器数量必然能
B、减少处理器数量有可能
C、减少处理器数量也不可能
D、增大处理器数量必然能
正确答案:


第4题,n*n的两个矩阵相乘,问题规模为____。
A、n
B、n^2
C、2n^2
D、n^3
正确答案:


第5题,并行计算还主要用于国防、工程研究等领域,这种说法是____。
A、正确的
B、错误的
正确答案:


第6题,MPI程序中发送和接收消息的两个进程必须____。
A、在同一个网段中
B、连接在同一个路由器上
C、在同一个通信域中
D、以上皆错
正确答案:


第7题,关于omp single指令,下面说法错误的是____。
A、线程组中只有一个线程执行代码
B、用于I/O或初始化等任务
C、是保持数据依赖所必须的
D、入口或出口无隐式barrier
正确答案:


第8题,超立方中相邻节点二进制编号____。
A、至少差1位
B、至多差1位
C、恰好差1位
D、差异不固定
正确答案:


第9题,一个SSE寄存器可容纳____个短整型数。
A、2
B、4
C、8
D、16
正确答案:


第10题,在下面问题中,SIMD并行最不适合____。
A、向量加法
B、向量中元素排序
C、矩阵向量乘法
D、矩阵加法
正确答案:


第11题,主线程创建了4个从线程,对它们执行pthread_join,然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序____。
A、必然主线程前、从线程后
B、必然从线程前、主线程后
C、必然相互交织
D、各种顺序皆有可能
正确答案:


第12题,对矩阵乘法进行多线程并行化,对矩阵采用____。
A、简单均匀块划分即可保证负载均衡
B、循环划分才能实现负载均衡
C、动态划分才能实现负载均衡
D、随机划分才能实现负载均衡
正确答案:


第13题,对于向量化,以下说法错误的是____。
A、总会有打包/解包开销
B、若运算对象连续存储,可消除打包开销
C、若运算结果连续存储,可消除解包开销
D、打包/解包开销由数据存储决定
正确答案:


第14题,SSE intrinsics _mm_load_pd命令的功能是____。
A、对齐向量读取单精度浮点数
B、未对齐向量读取单精度浮点数
C、对齐向量读取双精度浮点数
D、未对齐向量读取双精度浮点数
正确答案:


第15题,在128位的SIMD寄存器中,我们不能保存____。
A、16个8位整数
B、8个16位短整型
C、4个32位整型
D、16个字符的字符串
正确答案:


第16题,对于多线程各自进行本地运算,然后由主线程汇总结果的模式,下面说法正确的是____。
A、在同构核心上,线程运行速度一样,主线程无需等待,直接汇总结果即可
B、线程运行速度可能不一致,必须采用同步保证主线程汇总正确结果
C、太多本地运算,不能体现并行效果,不是好的模式
D、主线程汇总结果在性能上必然不如多线程并行汇总结果
正确答案:


第17题,编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。
A、创建和管理线程代码
B、循环划分给线程的代码
C、找出数据依赖的代码
D、线程同步的代码
正确答案:


第18题,OpenMP编译指示的作用范围是____。
A、其后一个语句
B、其后连续语句
C、其后直到函数结束
D、整个函数
正确答案:


第19题,SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=1则表示___。
A、将第一个源寄存器的第j个元素放在目标寄存器位置1
B、将第二个源寄存器的第j个元素放在目标寄存器位置1
C、将第一个源寄存器的第j个元素放在目标寄存器位置j
D、将第二个源寄存器的第j个元素放在目标寄存器位置j
正确答案:


第20题,编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A、2
B、4
C、8
D、16
正确答案:


第21题,CUDA共享内存是由____共享。
A、Grid中所有线程
B、一个Block中所有线程
C、一个Warp中所有线程
D、GPU中所有线程
正确答案:


第22题,记并行时间为T,串行时间为T',处理器数量为p,效率为E,则代价最优的定义是____。
A、pT'=T
B、E=Θ(1)
C、E=pT/T'
D、E=T'/pT
正确答案:


第23题,天河1A和天河2号都是主要依靠____获得强大的计算能力。
A、单核CPU
B、多核CPU
C、众核CPU
D、众核协处理器
正确答案:


第24题,在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率(商品组合)划分给不同进程,这是一种划分____的数据并行策略。
A、输入数据
B、中间结果
C、输出数据
D、临时数据
正确答案:


第25题,静态任务划分相对于动态任务划分的优点是____。
A、确保负载均衡
B、任务粒度细
C、计算复杂度低
D、并行效率高
正确答案:


第26题,对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。
A、声明语句
B、条件分支语句
C、循环语句
D、输入输出语句
正确答案:


第27题,GPU相对于其他众核产品的优势不包括____。
A、平台普及
B、有CUDA这样易学的开发工具
C、性价比高
D、由英伟达公司一家把控
正确答案:


第28题,CUDA寄存器是由____。
A、Grid中所有线程共享
B、一个Block中所有线程共享
C、一个Warp中所有线程共享
D、每个线程独享
正确答案:


第29题,采用搜索分解设计15数码问题的并行算法,不包含下面哪个步骤____。
A、串行生成一定规模的搜索树
B、当前每个叶结点为根的子树搜索分配给一个处理器
C、发现解的处理器通知其他处理器
D、将所有处理器的结果组合成最终解
正确答案:


第30题,关于MPI是什么,以下说法错误的是____。
A、一种消息传递编程模型标准
B、一种共享内存编程模型标准
C、编程角度看是C++/Fortran等的库
D、基于SPMD模型
正确答案:


第31题,OpenMP是___架构下的一种编程工具。
A、SIMD
B、MISD
C、共享内存
D、分布式内存
正确答案:


第32题,求解同一个问题的4个并行算法的等效率函数分析结果如下,其中____的可扩展性最优。
A、Θ(plogp)
B、Θ(p^2)
C、Θ(p^2logp)
D、Θ(p^3)
正确答案:


第33题,OpenMP归约指令采用的是一种____算法。
A、分治
B、贪心
C、动态规划
D、排序
正确答案:


第34题,一个函数是“线程安全的”,其含义是该函数____。
A、多线程执行能抵御网络攻击
B、多线程执行能保护用户隐私数据
C、多线程执行结果也是正确的
D、以上皆错
正确答案:


第35题,for (i=0; i10; i++) A = A+1; 此循环____数据依赖。
A、存在
B、不存在
C、不确定
D、以上皆错
正确答案:


第36题,利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是____。
A、降低了访存延迟
B、隐藏了访存延迟
C、利用了cache空间局部性
D、利用了cache时间局部性
正确答案:


第37题,OpenMP最常见的编程方式是寻找串行程序中____结构进行并行化。
A、赋值语句
B、循环语句
C、递归
D、输出语句
正确答案:


第38题,CUDA程序中不包括____。
A、host代码
B、device代码
C、kernel
D、图形渲染代码
正确答案:


第39题,OpenMP程序和Pthread程序中线程获得自身编号的方式分别是____。
A、两者均为创建线程时传递参数
B、两者均通过特定API
C、前者创建线程时传递参数,后者通过特定API
D、前者通过特定API,后者创建线程时传递参数
正确答案:


第40题,用GCC编译器编译SSE intrinsics程序,需使用编译选项
A、-march=corei7
B、-g
C、-O
D、-O2
正确答案:


第41题,现代CPU中都具有指令乱序执行功能,其目的不包括____。
A、消除指令依赖,更充分利用多流水线
B、提高cache效率
C、改变计算结果
D、消除资源冲突
正确答案:


第42题,并行计算的新兴应用领域不包括____。
A、制药
B、数字媒体
C、国防
D、游戏
正确答案:


第43题,采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在____。
A、CPU内存
B、GPU显存
C、GPU共享内存
D、GPU寄存器
正确答案:


第44题,对同一个问题的两个任务依赖图G1和G2,以下哪个条件不能表明G1优于G2____。
A、G1顶点权重之和小于G2
B、G1平均并发度大于G2
C、G1关键路径长度小于G2
D、G1顶点权重之和除以关键路径长度大于G2
正确答案:


第45题,当问题规模不变时,随着处理器数量增大,加速比____。
A、必然增大
B、必然减小
C、必然不变
D、以上皆错
正确答案:


第46题,关于OpenMP程序中的并行结构,以下说法正确的是____。
A、其结束时需程序员人为添加同步
B、其结束时OpenMP已默认添加隐式障碍
C、其结束时完全不需要同步
D、其结束时必须进行同步
正确答案:


第47题,当前并行软件面临的主要挑战不包括____。
A、能耗
B、伸缩性
C、研发周期
D、可靠性
正确答案:


第48题,关于互斥量mutex,下面说法错误的是____。
A、它将保护区域内的运算变成原子操作
B、任何时刻只允许一个线程进入保护区域
C、保险期间,对并发操作都应用互斥量保护
D、互斥量加锁、解锁开销远大于一般运算
正确答案:


第49题,SIMD架构未见于_____中。
A、多媒体扩展
B、图形和游戏处理器
C、计算机集群
D、协处理器
正确答案:


第50题,单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.
A、等于8
B、小于8
C、4到8之间
D、等于4
正确答案:
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  • 价格公开

  • 优质服务

  • 专属客服

  • 信息开放

  • 担保交易

 
 
客服一号
客服二号
客服三号
客服四号
点击这里给我发消息
官方微信扫一扫
快速回复 返回顶部 返回列表