传播复兴中华的思想
做理性的爱国者
有人说,我做一款AI芯片,只要原生支持PyTorch就好了呀,用户直接用PyTorch跑模型,根本接触不到CUDA呀。
没错,一般的用户只要在PyTorch层面做应用,但是总是有新的模型架构出来,这些架构都需要做特定的性能优化才能在一个芯片上得到较高的性能,这时候就涉及到算子开发了。
比如说一开始LLM在GPU上的性能不好,后来社区针对Nvidia GPU做了flash attention等的优化才把LLM的性能提升到了比较可观的程度。
CUDA已经被各种开源AI框…。
就是糊弄。 做法极其粗糙,压根对食材没啥精细操作的。 核...
2025-06-25 来源: 浏览: 次
本人是J***a技术面试官,自夸下,应该还算资深,有8,9年...
我想起了阿里的蒋太子 本周一的新闻:阿里架构调整——饿了么、...
槽点不少,修改前愣把小米手机和联想笔记本放进来,题主是懂流量...
约同事去自驾游, 有车的同事会说,明天早上8点在XX公交站等...
一、门口的植物不要太茂密,最好没有,或者定期除草。 二、大...
当你看过很多后,你就会发现,谁都没有什么惊艳的,图形都差不多...
有, 而且很高质量! (辛苦整理全是收藏,没有关注点赞和评论...
很莫名邀请这个问题,但是很巧午觉刚睡醒我又很闲,无聊到想分析...
我小时候大概7、8岁在舅舅家vcd上看过的一个片子,科幻片,...
强行松弛感,遍地打卡仙人,遍地人造网红景点。 以下所有图片...
(讲了下docker部署we***iate向量数据库,换源直...
试想一下,你周五从40公里外的乡***回到家,舒舒服服的洗了...
那自然是刘亦菲打枪图: 这颜值,这发量,这腰身,这曲...
康熙在位的时候,感染了疟疾,当时紫禁城里有全国最好的中医,但...