第513章 一块砖(1 / 2)

超级U盘 纸火花 2822 字 16天前

128核听起来很多,其实也就那么回事儿。

不过是11个全志a31soc的核心数罢了,人家毕竟是传说中的“四核八显12核心”!

说起来,gpu因为要在尽可能短时间内完成大量图像渲染任务,更加重视并行计算能力,向来有配备大量并发管线的传统。像是a31的八显,说的就是其内部有两颗sgx544gpu模块,各有4个被称为通用可拓展着色引擎us色2的渲染单元,结果本来只是双gpu的芯片就被奸商吹成了八显一开始还有些遮掩,只说是“八显”不说“八核显卡”,后来就彻底放开了。

而作为移动soc里面显示性能最强的女idia,他们家最新的平板soc产品tegrak1,更是因此而变成了逆天的192核显卡,似乎眼看着就要吊打桌面显卡了。

实际情况却不是这样,整个k1的热设计功耗只有5瓦,和桌面显卡暂时还没有比较的可能,至少只有96个cuda核心的双敏大狂牛gt440-4gb就能将其轻松秒杀。

狂牛系列显卡向来以看起来吓人的超大显存和不够给力的中低端gpu而着称于世,大显存成了奸商欺骗消费者的利器,弱核心廉价低速dd显存又成了硬件老鸟嘲笑厂家和小白用户的武器。然而,只有笑而不语的打金工作室老板才知道“好马配好鞍,打金用狂牛”,这卡其实还是很牛的。

对于普通人来说,以gf108gpu的速度,正常情况下根本用不完4gb显存。但是对于网游工作室来说,这种低价大显存显卡简直是为其量身定制的,他们并不在意画质什么的,反正为了流畅多开都是最低画质的,这种时候这种用内存颗粒充当低速显存的显卡就显得非常实用了,hold住十几个甚至几十个网游客户端毫无问题。

只可惜,现在毕竟是免费网游的天下,这些游戏普遍有着经济系统不健康道具贬值特别快的通病,以至于很多工作室选择了转行,改去玩计算力挖矿了。比起还需要安排小弟照看一二的网游多开打金业务,时下流行的计算力挖矿就更加简单了,只要网络和电力保持通畅,电脑开机就能给老板赚钱。

在国内最出名的两大计算力挖矿品牌,一个是国外最流行的逼tcoin比特币,另一个则是蜜蜂p币,或者说蜜蜂粮票。和价格随行就市的比特币不同,蜜蜂p币的价格一直保持稳中有降的趋势,虽然赚不了大钱但也不会像比特币那样因为价格大起大落而倒霉赔钱,沦为炒家收割的对象。

不过无论是挖比特币挣美元,还是跟着蜜蜂混赚点电费钱,都对计算机,尤其是gpu的计算能力有比较高的要求,尤其是比特币挖矿,一开始都是各种中高端显卡在挖,用到快废就折价卖二手,很是坑了一批贪便宜半价买高端显卡的玩家。以狂牛一般偏弱的gpu,自然是没有当“矿卡”的命。于是,以卖牛为生的双敏,卒。

不管是a记的sp流处理器,还是n记的cuda通用并行计算单元,亦或是intel家xeonphi的x86核心,都不是单独的“核”。论起结构的复杂度,完全不能和马竞的ipu相比较。毕竟前面三者都要考虑量产成本的问题,太过复杂的电路设计会导致生产工序的冗长和低容错率,自然是智者不为的。

实际上,马竞的ipu更像是威力加强版本的intel至强处理器。

intel下半年发布的,目前地球上最强大的量产cpu至强e5-2699v3拥有18个物理核心,每颗核心独享32+32kb高速l1缓存和256kb的l2缓存,再集体共享“高达”45mb的l3缓存。

芯片设计师们当然知道冯诺依曼瓶颈,于是很早就开始给cpu配置了cache高速缓存,且一般使用sram静态随机存储器,相比于内存条常用的dram动态存储器,前者的优点是不需要设置刷新电路,读写速度快,缺点则是电路集成度低、成本高。

无论是高成本,还是低集成度,对于cpu来说都是要命的,因此也就不难解释为什么时至今日,cpu的l1/l2一二级缓存的容量依旧以kb为单位了,倒是使用dram的l3缓存,倒是可以做得大一点也不能太大,毕竟芯片面积上每一毫米都是珍贵的。

当代u皇2699全部三-级缓存加起来也只有50mb的容量,对于应用程序来说自然是不够用的,当没有在缓存中找到数据,系统还是得去内存甚至更慢的硬盘当中去搜寻,自然进一步拖慢了速度。

而这些问题对于马竞来说,基本上都不是问题了。第一代ipu芯片的具体型号是128-16/16,指的自然是128颗运算核心,每颗都被分配了16mb一级缓存,然后再集体共享2gb三-级缓存,即核均16mb。

之所以能够做到这一点,一来是某人掌握黑科技,可以熟练地制造碳基芯片,唯一的问题就是“人工生产”导致产量太低,二来也是因为ipu的设计思路是全新的,不论是cpu还是gpu,以及动物神经系统,都是其参考借鉴的对象。比如显卡领域目前研发热点的hbm高带宽显存技术就被马竞借鉴了去。

既然基于内存都3d堆栈了,处理器部分更加不能继续平面化。实际上马竞在3d晶体管方面比intel和三星还要激进,毕竟人家要考虑工艺实现问题,而马竞却可以随便开脑洞,失败也不过是浪费几天时间罢了。

和动物们的神经系统相比,ipu128个自带“记忆”能力的计算核心并不算多,但是也基本够用了。马竞之前有测试过不同数量的方案,总得来说核心越少、“内存”越少效果越差,反之则约好。不过随着核心数的堆砌,以及“内存”的扩容,晶体管数目迅速增加,相应的芯片的厚度、面积和发热量也要增加,最终只能折衷选择了128-16/16这个方案。

人类大脑皮层平均厚度不到3毫米,但布满褶皱沟回,全部展开后总面积高达2200平方厘米,其中据估计含有约140亿个神经细胞。并且人的脑细胞数量每天还在减少,同样据估计每天有10万脑细胞阵亡,并且不会得到补充。好在“生物脑计算机”的自我纠错能力可比电子计算机强多了,死亡的脑细胞会被其他细胞迅速代替,通常不会动不动给你一个蓝屏死机。