|
【奥鹏】[南开大学]19秋学期(1709、1803、1809、1903、1909)《并行程序设计》在线作业
试卷总分:100 得分:100
第1题,n个节点的二维mesh中,节点最远通信距离为____。
A、1
B、O(logn)
C、O(sqrt(n))
D、O(n)
正确答案:
第2题,在SSE intrinsics程序中双精度浮点数数据类型是____。
A、__m128
B、__m128f
C、__m128d
D、__m128i
正确答案:
第3题,下面矩阵运算中,哪个进行简单的数据并行效果不佳____。
A、矩阵求和
B、矩阵相乘
C、矩阵向量相乘
D、高斯消去
正确答案:
第4题,CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为
A、8MFlops
B、125MFlops
C、1GFlops
D、4GFlops
正确答案:
第5题,对MPI通信中发送方和接受方的类型匹配,下面错误的说法是____。
A、均使用相同数据类型
B、均使用MPI_BYTE
C、均使用MPI_PACKED
D、使用相容类型
正确答案:
第6题,以下哪条不是推动并行计算发展的因素?
A、存储是系统瓶颈
B、单CPU发展已能满足应用需求
C、利用标准硬件构造并行机令升级容易
D、编程环境标准化逐步发展
正确答案:
第7题,在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术,则多线程版本____串行版本。
A、肯定快于
B、肯定慢于
C、可能快于
D、以上皆错
正确答案:
第8题,对这样的循环for (i=0; i100; i+=1) A[i+0] = A[i+0] + B[i+0]; 进行向量化,基本技术手段是____。
A、循环划分
B、循环消除
C、循环展开
D、以上皆错
正确答案:
第9题,静态线程编程模式的优点是____。
A、线程负载均衡
B、线程通信效率高
C、线程管理开销低
D、系统资源利用率高
正确答案:
第10题,MPI基本原语不包括____。
A、MPI_Barrier
B、MPI_Comm_rank
C、MPI_Comm_size
D、MPI_Init
正确答案:
第11题,OpenMP是___的一个常见替代。
A、SSE
B、MPI
C、Pthread
D、CUDA
正确答案:
第12题,循环需满足特定条件才能进行OpenMP并行化,下列哪个条件是错误的____。
A、循环变量应为带符号整数
B、终止检测必须是与循环不变量的比较
C、循环变量每步递增/递减一个循环不变量
D、循环体无进/出控制流
正确答案:
第13题,16步循环,4个线程,循环0-1和8-9、2-3和10-11、4-5和12-13、6-7和14-15分别分配给线程0、1、2、3,这是OpenMP的____划分策略。
A、static
B、fixed
C、dynamic
D、guided
正确答案:
第14题,经典冯诺依曼架构执行一条指令的过程中不包括哪个操作?
A、取指令
B、解码
C、安全性检查
D、执行指令
正确答案:
第15题,造成超线性加速比的你原因包括____。
A、进程间大量通信
B、并行算法导致额外计算
C、并行计算工作量显著小于串行计算
D、问题求解包含不可并行化部分
正确答案:
第16题,矩阵每行排序的问题更适合使用MPI的____编程模型。
A、阻塞的
B、非阻塞的
C、对等的
D、主从的
正确答案:
第17题,SIMD架构未见于_____中。
A、多媒体扩展
B、图形和游戏处理器
C、计算机集群
D、协处理器
正确答案:
第18题,pthread_rwlock_wrlock是对读写锁进行____操作。
A、加锁
B、解锁
C、加读琐
D、加写锁
正确答案:
第19题,以下超级计算机中,____是SIMD架构。
A、CRAY-1
B、天河1A
C、天河2号
D、神威.太湖之光
正确答案:
第20题,编写矩阵乘法的Neon程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A、2
B、4
C、8
D、16
正确答案:
第21题,CUDA的优点不包括____。
A、可移植性
B、入门简单
C、标准的SPMD模式
D、不再需要图形API
正确答案:
第22题,OpenMP中多线程间是一种____关系。
A、主从
B、分组
C、对等
D、竞争
正确答案:
第23题,SSE intrinsics _mm_store_sd命令的功能是____。
A、对齐向量存单精度浮点数
B、未对齐向量存单精度浮点数
C、对齐标量存双精度浮点数
D、未对齐标量存双精度浮点数
正确答案:
第24题,并行算法的额外开销不包括____。
A、进程间通信
B、进程等待I/O
C、进程空闲
D、额外计算
正确答案:
第25题,对于搜索分解,下面哪个说法是错误的_____。
A、所有子树搜索任务都必须全部完成
B、工作量可能大于串行计算
C、工作量可能小于串行计算
D、可能产生超线性加速比
正确答案:
第26题,编写矩阵乘法的SSE程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A、2
B、4
C、8
D、16
正确答案:
第27题,对矩阵乘法串行程序的主体三重循环,我们选择最内层循环进行向量化的原因是____。
A、它最后执行
B、外层循环中没有计算操作
C、是随意选择的
D、它的连续循环步是对不同元素进行相同运算
正确答案:
第28题,每个SSE寄存器宽度为____位。
A、32
B、64
C、128
D、256
正确答案:
第29题,AVX是____平台的SIMD架构。
A、x86
B、POWER
C、SPARC
D、ARM
正确答案:
第30题,主线程创建了4个从线程然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序____。
A、必然主线程前、从线程后
B、必然从线程前、主线程后
C、必然相互交织
D、各种顺序皆有可能
正确答案:
第31题,在使用互斥量之前必须对其进行____。
A、初始化
B、加锁
C、解锁
D、销毁
正确答案:
第32题,Neon是____平台的SIMD架构。
A、x86
B、POWER
C、SPARC
D、ARM
正确答案:
第33题,对于效率E,下面描述错误的是____。
A、理想并行E=1
B、总是在0~1之间
C、可能1
D、可能随着处理器数量增大趋向于0
正确答案:
第34题,OpenMP的缺点不包括____。
A、常见并行结构的表达并不总可行
B、局部性处理不易
C、不易编写多核单核通用程序
D、性能控制不易
正确答案:
第35题,____执行pthread_sem_wait操作,线程进入阻塞状态。
A、当信号量已加锁时
B、当信号量为0时
C、当信号量已超过阈值时
D、当信号量已销毁时
正确答案:
第36题,对矩阵乘法进行多线程并行化,对矩阵采用____。
A、简单均匀块划分即可保证负载均衡
B、循环划分才能实现负载均衡
C、动态划分才能实现负载均衡
D、随机划分才能实现负载均衡
正确答案:
第37题,对天气预报问题,将大气层划分为5*10^8个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为10分钟,计算10天内大气运动,100MFlops计算能力的计算机需要多少天?
A、1
B、10
C、100
D、300
正确答案:
第38题,当处理器数量不变时,随着问题规模增大,效率增大对____成立。
A、部分并行算法
B、所有并行算法
C、所有并行算法都不
D、以上皆错
正确答案:
第39题,将起泡排序程序改写为奇偶转置排序,关于其两层循环是否存在数据依赖,下面说法正确的是____。
A、外层存在,内层不存在
B、外层不存在,内层存在
C、两层都不存在
D、两层都存在
正确答案:
第40题,动态任务划分相对于静态任务划分的优点是____。
A、确保负载均衡
B、通信开销低
C、实现简单
D、计算复杂度低
正确答案:
第41题,将t个线程的局部结果汇总,可采用递归分解并行进行,即,两两汇总,中间结果继续两两汇总,直到剩下唯一的最终结果,其时间复杂度为____。
A、Θ(1)
B、Θ(logt)
C、Θ(t)
D、Θ(tlogt)
正确答案:
第42题,pthread_sem_post是对信号量进行____操作。
A、加锁
B、解锁
C、加1
D、减1
正确答案:
第43题,新一代GPU重点提供的新特性不包括____。
A、新型高速显存
B、GPU间直接高速互联
C、自动并行化
D、人工智能计算专门优化
正确答案:
第44题,n个处理器、n个内存模块的交叉开关构造成本为____。
A、O(logn)
B、O(n)
C、O(nlogn)
D、O(n^2)
正确答案:
第45题,OpenMP编译指示中说明共享变量是用____子句。
A、private
B、shared
C、schedule
D、nowait
正确答案:
第46题,SSE intrinsics _mm_load_ps命令的功能是____。
A、对齐向量读取单精度浮点数
B、未对齐向量读取单精度浮点数
C、对齐向量读取双精度浮点数
D、未对齐向量读取双精度浮点数
正确答案:
第47题,对单精度浮点数矩阵乘法程序进行SSE并行化,预期加速比为____。
A、等于8
B、4到8之间
C、等于4
D、小于4
正确答案:
第48题,SSE intrinsics _mm_load_pd命令的功能是____。
A、对齐向量读取单精度浮点数
B、未对齐向量读取单精度浮点数
C、对齐向量读取双精度浮点数
D、未对齐向量读取双精度浮点数
正确答案:
第49题,OpenMP不能实现的是____。
A、负责创建和管理线程
B、隐藏栈管理
C、提供同步机制
D、自动并行化
正确答案:
第50题,在应用中____的情况下读写锁相对于互斥量的性能优势更明显。
A、读写操作较为平均
B、读操作远远多于写操作
C、写操作远远多于读操作
D、以上皆错
正确答案:
|
|