奥鹏答案网-奥鹏作业答案-奥鹏在线作业答案-奥鹏离线作业答案-奥鹏毕业论文-专业奥鹏作业答案辅导网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 174|回复: 0

南开大学19秋学期(1709、1803、1809、1903、1909)《并行程序设计》在线作业

[复制链接]

9485

主题

9485

帖子

2万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
28607
发表于 2019-10-29 16:49:06 | 显示全部楼层 |阅读模式
试卷名称:19秋学期(1709、1803、1809、1903、1909)《并行程序设计》在线作业-0003
1.n个节点的二维mesh中,节点最远通信距离为____。
A.1
B.O(logn)
C.O(sqrt(n))
D.O(n)
答案:-

2.在SSE intrinsics程序中双精度浮点数数据类型是____。
A.__m128
B.__m128f
C.__m128d
D.__m128i
答案:-

3.下面矩阵运算中,哪个进行简单的数据并行效果不佳____。
A.矩阵求和
B.矩阵相乘
C.矩阵向量相乘
D.高斯消去
答案:-

4.CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为
A.8MFlops
B.125MFlops
C.1GFlops
D.4GFlops
答案:-

5.对MPI通信中发送方和接受方的类型匹配,下面错误的说法是____。
A.均使用相同数据类型
B.均使用MPI_BYTE
C.均使用MPI_PACKED
D.使用相容类型
答案:-

6.以下哪条不是推动并行计算发展的因素?
A.存储是系统瓶颈
B.单CPU发展已能满足应用需求
C.利用标准硬件构造并行机令升级容易
D.编程环境标准化逐步发展
答案:-

7.在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术,则多线程版本____串行版本。
A.肯定快于
B.肯定慢于
C.可能快于
D.以上皆错
答案:-

8.对这样的循环for (i=0; i100; i+=1) A[i+0] = A[i+0] + B[i+0]; 进行向量化,基本技术手段是____。
A.循环划分
B.循环消除
C.循环展开
D.以上皆错
答案:-

9.静态线程编程模式的优点是____。
A.线程负载均衡
B.线程通信效率高
C.线程管理开销低
D.系统资源利用率高
答案:-

10.MPI基本原语不包括____。
A.MPI_Barrier
B.MPI_Comm_rank
C.MPI_Comm_size
D.MPI_Init
答案:-

11.OpenMP是___的一个常见替代。
A.SSE
B.MPI
C.Pthread
D.CUDA
答案:-

12.循环需满足特定条件才能进行OpenMP并行化,下列哪个条件是错误的____。
A.循环变量应为带符号整数
B.终止检测必须是与循环不变量的比较
C.循环变量每步递增/递减一个循环不变量
D.循环体无进/出控制流
答案:-

13.16步循环,4个线程,循环0-1和8-9、2-3和10-11、4-5和12-13、6-7和14-15分别分配给线程0、1、2、3,这是OpenMP的____划分策略。
A.static
B.fixed
C.dynamic
D.guided
答案:-

14.经典冯诺依曼架构执行一条指令的过程中不包括哪个操作?
A.取指令
B.解码
C.安全性检查
D.执行指令
答案:-

15.造成超线性加速比的你原因包括____。
A.进程间大量通信
B.并行算法导致额外计算
C.并行计算工作量显著小于串行计算
D.问题求解包含不可并行化部分
答案:-

16.矩阵每行排序的问题更适合使用MPI的____编程模型。
A.阻塞的
B.非阻塞的
C.对等的
D.主从的
答案:-

17.SIMD架构未见于_____中。
A.多媒体扩展
B.图形和游戏处理器
C.计算机集群
D.协处理器
答案:-

18.pthread_rwlock_wrlock是对读写锁进行____操作。
A.加锁
B.解锁
C.加读琐
D.加写锁
答案:-

19.以下超级计算机中,____是SIMD架构。
A.CRAY-1
B.天河1A
C.天河2号
D.神威.太湖之光
答案:-

20.编写矩阵乘法的Neon程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A.2
B.4
C.8
D.16
答案:-

21.CUDA的优点不包括____。
A.可移植性
B.入门简单
C.标准的SPMD模式
D.不再需要图形API
答案:-

22.OpenMP中多线程间是一种____关系。
A.主从
B.分组
C.对等
D.竞争
答案:-

23.SSE intrinsics _mm_store_sd命令的功能是____。
A.对齐向量存单精度浮点数
B.未对齐向量存单精度浮点数
C.对齐标量存双精度浮点数
D.未对齐标量存双精度浮点数
答案:-

24.并行算法的额外开销不包括____。
A.进程间通信
B.进程等待I/O
C.进程空闲
D.额外计算
答案:-

25.对于搜索分解,下面哪个说法是错误的_____。
A.所有子树搜索任务都必须全部完成
B.工作量可能大于串行计算
C.工作量可能小于串行计算
D.可能产生超线性加速比
答案:-

26.编写矩阵乘法的SSE程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A.2
B.4
C.8
D.16
答案:-

27.对矩阵乘法串行程序的主体三重循环,我们选择最内层循环进行向量化的原因是____。
A.它最后执行
B.外层循环中没有计算操作
C.是随意选择的
D.它的连续循环步是对不同元素进行相同运算
答案:-

28.每个SSE寄存器宽度为____位。
A.32
B.64
C.128
D.256
答案:-

29.AVX是____平台的SIMD架构。
A.x86
B.POWER
C.SPARC
D.ARM
答案:-

30.主线程创建了4个从线程然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序____。
A.必然主线程前、从线程后
B.必然从线程前、主线程后
C.必然相互交织
D.各种顺序皆有可能
答案:-

31.在使用互斥量之前必须对其进行____。
A.初始化
B.加锁
C.解锁
D.销毁
答案:-

32.Neon是____平台的SIMD架构。
A.x86
B.POWER
C.SPARC
D.ARM
答案:-

33.对于效率E,下面描述错误的是____。
A.理想并行E=1
B.总是在0~1之间
C.可能1
D.可能随着处理器数量增大趋向于0
答案:-

34.OpenMP的缺点不包括____。
A.常见并行结构的表达并不总可行
B.局部性处理不易
C.不易编写多核单核通用程序
D.性能控制不易
答案:-

35.____执行pthread_sem_wait操作,线程进入阻塞状态。
A.当信号量已加锁时
B.当信号量为0时
C.当信号量已超过阈值时
D.当信号量已销毁时
答案:-

36.对矩阵乘法进行多线程并行化,对矩阵采用____。
A.简单均匀块划分即可保证负载均衡
B.循环划分才能实现负载均衡
C.动态划分才能实现负载均衡
D.随机划分才能实现负载均衡
答案:-

37.对天气预报问题,将大气层划分为5*10^8个网格单元,每个时间步每个网格需200个浮点运算,时间间隔设置为10分钟,计算10天内大气运动,100MFlops计算能力的计算机需要多少天?
A.1
B.10
C.100
D.300
答案:-

38.当处理器数量不变时,随着问题规模增大,效率增大对____成立。
A.部分并行算法
B.所有并行算法
C.所有并行算法都不
D.以上皆错
答案:-

39.将起泡排序程序改写为奇偶转置排序,关于其两层循环是否存在数据依赖,下面说法正确的是____。
A.外层存在,内层不存在
B.外层不存在,内层存在
C.两层都不存在
D.两层都存在
答案:-

40.动态任务划分相对于静态任务划分的优点是____。
A.确保负载均衡
B.通信开销低
C.实现简单
D.计算复杂度低
答案:-

41.将t个线程的局部结果汇总,可采用递归分解并行进行,即,两两汇总,中间结果继续两两汇总,直到剩下唯一的最终结果,其时间复杂度为____。
A.Θ(1)
B.Θ(logt)
C.Θ(t)
D.Θ(tlogt)
答案:-

42.pthread_sem_post是对信号量进行____操作。
A.加锁
B.解锁
C.加1
D.减1
答案:-

43.新一代GPU重点提供的新特性不包括____。
A.新型高速显存
B.GPU间直接高速互联
C.自动并行化
D.人工智能计算专门优化
答案:-

44.n个处理器、n个内存模块的交叉开关构造成本为____。
A.O(logn)
B.O(n)
C.O(nlogn)
D.O(n^2)
答案:-

45.OpenMP编译指示中说明共享变量是用____子句。
A.private
B.shared
C.schedule
D.nowait
答案:-

46.SSE intrinsics _mm_load_ps命令的功能是____。
A.对齐向量读取单精度浮点数
B.未对齐向量读取单精度浮点数
C.对齐向量读取双精度浮点数
D.未对齐向量读取双精度浮点数
答案:-

47.对单精度浮点数矩阵乘法程序进行SSE并行化,预期加速比为____。
A.等于8
B.4到8之间
C.等于4
D.小于4
答案:-

48.SSE intrinsics _mm_load_pd命令的功能是____。
A.对齐向量读取单精度浮点数
B.未对齐向量读取单精度浮点数
C.对齐向量读取双精度浮点数
D.未对齐向量读取双精度浮点数
答案:-

49.OpenMP不能实现的是____。
A.负责创建和管理线程
B.隐藏栈管理
C.提供同步机制
D.自动并行化
答案:-

50.在应用中____的情况下读写锁相对于互斥量的性能优势更明显。
A.读写操作较为平均
B.读操作远远多于写操作
C.写操作远远多于读操作
D.以上皆错
答案:-
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  • 价格公开

  • 优质服务

  • 专属客服

  • 信息开放

  • 担保交易

 
 
客服一号
客服二号
客服三号
客服四号
点击这里给我发消息
官方微信扫一扫
快速回复 返回顶部 返回列表