CUDA-NVIDIA-冬令营01
创始人
2025-05-28 17:34:38
0

问题

MOORE’S LAW:芯片的集成密度每两年翻翻,成本下降一半。计算CORE是由面积决定的,面积越大理论上晶体管的数目越多,晶体管数目的大小直接关系到CPU的计算速度。
CPU面临的问题:

问题一:时钟频率墙。晶体管越来越多,单位面积晶体管越来越多,能量密度非常大,散热非常多。(能量密度接近核电站了)材料无法承受。
问题二:存储器墙。上下行数据越来越多,但数据需要放在存储器上,所以存储器数据带宽压力很大,无法保证能及时放到内存上。

于是,CPU遇到的瓶颈,只能向多核及并行系统发展。顺势而生的GPU - Graphics Processing Unit

CPU更强调流水线(即指令很多,协调)优化。
协处理器,无法直接访问存储器。CPU和GPU访问同一块处理器是趋势,节省了CPU数据传输给GPU用的时间。

处理解决问题的思维改过来。
串行解决问题和并行解决问题的思维是不同的。
把一个大任务分发给小的核心。

CUDA适合应用多个计算资源解决一个计算问题。
问题被分解为多个离散的部分,可以同时处理。

想优化:
加速比
计算的关键核心耗时点在哪。除去数据通信,数据控制流,无法用GPU并行优化。

相关内容

热门资讯

哇!贡菜这么拌绝了!脆爽开胃三... 亲爱的小伙伴们,今天我要和大家分享一道超级简单又美味的家常凉菜——凉拌贡菜。这道菜清爽开胃,口感脆嫩...
从田间到舌尖,尽显“咖”位!《... 5月29日 《人民日报海外版》第5版刊文 点赞跨越国界“圈粉”无数的云南咖啡 从田间到舌尖 云南咖啡...
一碗风味藏古洼故事 2025“... 烟火升腾处,文脉传承时。5月28日,2025“寻味文安”美食大赛在文安火热开赛。这场汇聚传统与创新的...
windows提权之本地溢出漏... 0x00 前言使用溢出漏洞步骤:1.信息搜集主要搜集操作系统版本 漏洞补丁 位数 杀软...
皮薄馅儿大的糯米烧麦,这样做软... 皮薄馅儿大的糯米烧麦,这样做软糯鲜香,一口一个,好吃不能停! 在美食的世界里,有一种美味,它既能够...
比茅台还猛!凭借均价5元一杯的... 凭借均价5元一杯的奶茶,蜜雪冰城正在造就一个商业帝国。 5月27日,蜜雪集团的股价飙升至579港元,...
吉安遂川板鸭「咸香」!柴火熏制... 吉安遂川板鸭,以 “咸香” 闻名遐迩,柴火熏制的独特工艺赋予其无可比拟的风味。本文将从历史传承、制作...
【视频】南京方言发音人陈宗霞:... “我们的传统节日往往与美食紧密相连,就拿糕团来说,不仅与节令相关,背后还有许多历史故事,用南京话讲,...
Linux系统中内核态、用户态... ​目录 ​第一:存储介质的性能 ​第二:内核态和用户态 第三࿱...
[pytorch]thop计算... 从github官网上转载的: Count the MACs / FLOPs of yo...
CDGA|数字化转型成功的关键... 根据一些知名的战略咨询公司的调研结论,80%的企业数字化转型是失败的。那么想要在数字化...
【Java|golang】23... 给你一个长度为 n 的整数数组 nums ,和一个长度为 m 的整数数组 querie...
C++/MFC工程[1]——创...  一、创建新项目 1、选择“MFC应用”,点击“下一步” 2、 配置项目 默认项目...
【文心一言】什么是文心一言,如... 文心一言什么是文心一言怎么获得内测资格接下来就给大家展示一下文学创作商业文案创作数理逻辑推算中文理解...
“世界市长对话·上海”开启 共... (配本社同题文字稿) 5月29日拍摄的世界市长对话·上海暨2025年上海国际友好城市合作论坛现场。...
DeepSeek-R1更新,官... 每经编辑:黄胜 5月29日晚间,深度求索微信公众号公布了 DeepSeek-R1-0528 更新的详...
五分钟了解一致性hash算法,... 五分钟了解一致性hash算法,为什么负载均衡常用一致性hash实现?导读...
LeetCode-322.零钱... 目录题目思路回溯法动态规划动态规划(压缩) 题目来源 322. 零钱兑换 题目思路 1.可以重复选&...
CSS面试题 CSS面试题CSS 伪类和伪元素CSS中的文字阴影与盒子阴影CSS属性选择器 CSS 伪类和伪元素 ...