AMD Red Team 红色小队论坛

 找回密码
 立即注册
楼主: nanamiyaskit

RX Vega 12核心测试

  [复制链接]

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-1 10:04:46 | 显示全部楼层
根据楼主的实测的预计功耗和温度,如果增加规模,那么温度和功耗也会相应提高.换成7NM这两点下降,也可以增加.有个严重的问题就是RX580 2048SP 256位或者7NM新版,有可能是制程版,市场交叉重叠,GF14NM和海力士产能不够,还有马上代工的台积电.除非大力发展整合芯片,代工商看到前景,有需求才能拉动供给.作为台式机显卡定位又有些不合适,下方民用目前不需要更强大的计算性能,图形和民用计算,温度能耗要合理.I/O芯片有可能也具备不同模块的连接,APU的一个DIE捆绑在一起也影响CPU和GPU一起壮大.工程PCB应该是根据对应的芯片做的分级芯片的前期验证修改使用,不同级别去重新设计也是成本.

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-1 10:09:21 | 显示全部楼层
本帖最后由 冶天 于 2019-5-1 10:18 编辑

看到VEGA 12芯片规模,还是有些大.7NM和5NM应该继续缩小面积,HBM2 1024位,5NM整合市场应该需要重视.前些天还报道R1000的合作.能够做到I/OCPU加GPUAPU芯片55W-90W,具备RX470-RX570,各个整合嵌入市场的专业和民用都能胜任.APU的单DIE版做5W-35W.

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-1 10:26:04 | 显示全部楼层
8G显存现在是游戏,显示器分辨率卖点.用不到更多图形存储显存的市场.1-4G显存够用也实际.HBM2的芯片温度功耗,更加小型化的整合,整合芯片的设计难度有所增加,也导致量产不是很高.

79

主题

1263

帖子

2万

积分

铁杆A饭

Huden的本体

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
17802
经验
10
贡献
20
发表于 2019-5-1 11:17:58 | 显示全部楼层
nanamiyaskit 发表于 2019-4-30 11:48
这个核心在单独的卡上,可以直接安装在普通PC机上用

那么独显岂不是不远了,爽爆!!
For AMD Radeon™

79

主题

1263

帖子

2万

积分

铁杆A饭

Huden的本体

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
17802
经验
10
贡献
20
发表于 2019-5-1 11:18:19 | 显示全部楼层

我可以偷图发到红队群里吗
For AMD Radeon™

7

主题

130

帖子

4972

积分

R580

Rank: 6Rank: 6

精华
0
金币
3812
经验
10
贡献
10
 楼主| 发表于 2019-5-1 21:25:49 | 显示全部楼层
HudenJear 发表于 2019-5-1 11:18
我可以偷图发到红队群里吗

可以哦,记得说明出处即可

7

主题

130

帖子

4972

积分

R580

Rank: 6Rank: 6

精华
0
金币
3812
经验
10
贡献
10
 楼主| 发表于 2019-5-1 21:26:09 | 显示全部楼层
HudenJear 发表于 2019-5-1 11:18
我可以偷图发到红队群里吗

可以哦,记得说明出处即可

7

主题

130

帖子

4972

积分

R580

Rank: 6Rank: 6

精华
0
金币
3812
经验
10
贡献
10
 楼主| 发表于 2019-5-1 21:30:01 | 显示全部楼层
冶天 发表于 2019-5-1 10:26
8G显存现在是游戏,显示器分辨率卖点.用不到更多图形存储显存的市场.1-4G显存够用也实际.HBM2的芯片温度功耗 ...

我自己测试的话感觉6-8GB在游戏市场还是有必要的,低端现在都开始标配4GB显存也是很能说明问题。现在的游戏仅仅是1080P就能吃掉5-6GB显存,而游戏高清的纹理在不过于耗费GPU的前提下还是能带来蛮大的观感提升的。

7

主题

130

帖子

4972

积分

R580

Rank: 6Rank: 6

精华
0
金币
3812
经验
10
贡献
10
 楼主| 发表于 2019-5-1 21:42:16 | 显示全部楼层
冶天 发表于 2019-5-1 10:04
根据楼主的实测的预计功耗和温度,如果增加规模,那么温度和功耗也会相应提高.换成7NM这两点下降,也可以增加. ...

确实市场重叠了所以AMD完全没有必要在民用市场继续推出这样的产品。以前没有发行的HD5950也是一个例子,怕影响HD5970的市场。其实这块芯片还是蛮头疼的,现在有个疑问就是这块Vega 12 20cu就是满血了吗,还是说有更多的单元没有被开启,这些就不清楚了。看这个芯片规模总觉得实际流处理器数量会更多,1280SP也实在不算多。

7

主题

130

帖子

4972

积分

R580

Rank: 6Rank: 6

精华
0
金币
3812
经验
10
贡献
10
 楼主| 发表于 2019-5-1 21:45:05 | 显示全部楼层
冶天 发表于 2019-5-1 10:09
看到VEGA 12芯片规模,还是有些大.7NM和5NM应该继续缩小面积,HBM2 1024位,5NM整合市场应该需要重视.前些天还 ...

1024bit HBM2频率得看AMD能优化提高到啥地步了,性能级的话1000Mhz比较理想,但是还是得看最后核心搭配以及市场的取向了,还是超级麻烦的。

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-1 21:47:17 | 显示全部楼层
本帖最后由 冶天 于 2019-5-1 21:49 编辑
nanamiyaskit 发表于 2019-5-1 21:30
我自己测试的话感觉6-8GB在游戏市场还是有必要的,低端现在都开始标配4GB显存也是很能说明问题。现在的游 ...

纹理的GPU和显存关系到用户的视觉感受,标配4G能说明问题,但也是需要合理的GPU规模架构频率.部分显卡厂商有的还是为利润不做对应的GPU芯片和显存,不够用的GPU现在也是大显存,带不动,这类用户使用图形方面不多,即便用到的占用也到不了4G.购买选用还是按实际情况,不盲目吃亏.根据现在低端14/12NM或者7NMGDDR现在可以2G起步,HBM起步都是单颗4G.VEGA12如果不极限使用模型纹理光照4G也可以满足,规模和频率限制抗压性和帧率不是很好看,HBM是新型存储高端的代名词.有些单元架构传输等没有改变,测出来RX560系列图形性能,根本没法发售到台式机和外接独显的笔记本市场.好像计算卡市场也没看到发售零售身影.定位很重要,又要能发挥作用的市场.

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-1 21:52:08 | 显示全部楼层
nanamiyaskit 发表于 2019-5-1 21:42
确实市场重叠了所以AMD完全没有必要在民用市场继续推出这样的产品。以前没有发行的HD5950也是一个例子, ...

样品芯片很可能是工程方面的分级使用,官方内部有方式.

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-1 21:55:12 | 显示全部楼层
本帖最后由 冶天 于 2019-5-1 22:01 编辑

https://baijiahao.baidu.com/s?id ... 5&wfr=spider&for=pc https://www.expreview.com/58093.html HBM3 4G频率(每次预计高频,还是要看能卖的) http://news.mydrivers.com/1/517/517574.htm 不断降频的HBM2 HBM1位宽高,空间上不去.也不可能去做八颗,显存控制器和显存制程达不到.

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-1 22:33:56 | 显示全部楼层
本帖最后由 冶天 于 2019-5-1 23:25 编辑

https://www.expreview.com/41366.html
http://tieba.baidu.com/p/5978270499
换个参照物假设来重新看,FIJI和VEGA如果使用GDDR5/X GDDR6或者HBM设计提频还是手动超频.那么GDDR满足,规模大了的带宽要求还是GPU频率不够无法发挥GDDR,HBM提高,核心频率不算太高太低,实际表现有所提高.这两者没法一起去判断是核心不给力还是显存拖后腿,http://news.mydrivers.com/1/624/624941.htm NAVI换GDDR6版. http://tieba.baidu.com/p/5967239871 里面提到HBM超频提高大于内核超频.VEGA64 HBM2 945MHZ GCN的方向可能被改过,从FIJI来看,关于HBM的信息都是位宽空间,频率次数提到的也不少.因为市场环境,又只能去用制程提高频率,影响架构内核配合HBM的设计.HBM量产率不高,频率也没达到.用户来看不是性价比高的成熟.CU单元的读写吞吐交换量很可能是被周边单元制约,规模大频率无法更高,1080P的分辨率的内核存储数据量传输的延迟会直接影响每一帧的生成拷贝的时间间隔,有没有其它CU单元的SP浪费还是使用,没有专门的监控单元的软件确认.64组CU,4096SP也可能是配合HBM2的低频.可能可以增加或者内核修改,市场不会等待.HBM显存控制器可以支持的规模可能是很大很宽的,也包括未来使用模块单元,频率不足以支撑内核.旗舰这几年都是高成本方案,现在的更高性能的专业领域也是HBM2.HBM显存控制器是否会和HBM显存融合,I/O会连接HBM?这三种一体,类似ZEN2核心和I/O在芯片上并存?既要做高性能吞吐兼容又要做大规模满足4K-8K屏幕分辨率.最后这些瞎猜就不要当真了,以后怎么样没人知道.

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-2 08:01:58 | 显示全部楼层
本帖最后由 冶天 于 2019-5-2 08:16 编辑

测试有个细节没有注意,AIDA64的GPU读写性能是不是因为本身VEGA12不完全是HBM2 1024位这一个方面导致,也包括CU的SP单元和频率.先不谈更高规格的VEGA64的CU.多少规模和频率可以榨干HBM 1024位的750MHZ频率,HBM 1024位是否拉低了1280SP 20CU的数据供给.理论上来说GPU和HBM还是有一定的提高空间.个人调教探索测试还是存在风险.从极限潜力来看肯定不是只有RX560系列的图形性能,RX470-RX570定位.最近部分降价799-899,整合市场为999-1199是可以接受的,毕竟适用不同,设计不同,价格稍高一些,如果有销售整个产品会更贵.除了产能还有市场普及,层层加价,就不实,又更难卖,最后还是选用传统CPU独显产品,用户支出的总价一样不低,利润搭配性能品质都不一样.功能型的整合产品也有更多的特定设计搭配和软件需求.倒是可以降低这类用户的周期和选购难度,能直接就用的产品对行业来说是最方便的.

7

主题

130

帖子

4972

积分

R580

Rank: 6Rank: 6

精华
0
金币
3812
经验
10
贡献
10
 楼主| 发表于 2019-5-2 09:12:15 | 显示全部楼层
冶天 发表于 2019-5-2 08:01
测试有个细节没有注意,AIDA64的GPU读写性能是不是因为本身VEGA12不完全是HBM2 1024位这一个方面导致,也包括 ...

是这样没错,vega12按目前得规格和表现看在民用市场确实不够好,本身成本也不低。其实我比较疑惑的一点就是这个核心是真的只有20CU还是说只开启了20CU.本来想试一试拉频率提高核心性能,但是无论什么软件都还没有办法实现这个操作了,BIOS能提取出来但也是没有办法去修改。所以还是挺难验证瓶颈所在吧。确实一个产品的规格和市场需求平衡实在太难了,我不是职业的也只能从爱好者角度去讨论,有错误在所难免哈哈。

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-2 10:01:20 | 显示全部楼层
本帖最后由 冶天 于 2019-5-2 10:05 编辑
nanamiyaskit 发表于 2019-5-2 09:12
是这样没错,vega12按目前得规格和表现看在民用市场确实不够好,本身成本也不低。其实我比较疑惑的一点就 ...

我们都是兴趣爱好.^_^只能说是工程品,是否送样第三方都不清楚.无法进入市场,就没有普通方案和强化方案给用户和玩家.

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-2 13:26:56 | 显示全部楼层
本帖最后由 冶天 于 2019-5-2 15:28 编辑

http://tieba.baidu.com/p/5985956326 又看到一条测试HBM2频率的,请仔细看VEGA56显存读写,HBM2 2048位,两倍位宽VEGA12的1024位也很低,看不到显存具体频率.https://post.smzdm.com/p/ar074qpx/ RX590 2304SP显存读写和VEGA56差不多.http://tiebac.baidu.com/p/4074484133?pid=76620355873&see_lz=1 FIJI HBM1 4096位 稍低 HBM2 2048位,也稍低于256位GDDR5. HBM2 1024位 750MHZ,单颗通道.HBM1 4096位,500MHZ,四颗通道.GDDR5,256位 32位显存通道合计八通道四组,频率2000MHZ,总计8000MHZ.
VEGA12 HBM2 1024位 1000MHZ能提供的带宽才能相当于HBM1 2048位 两颗通道.750MHZ的HBM2的频率和HBM1比,单颗增加,两颗下降,我查了HBM是需要频率*2,HBM2 1024位1500M.HBM1 1024位 1000M 2048位 2000M,读写相差500M,FIJI如果是2048位,五位数的显存读写要下降一半四位数.如果和GDDR5的2000MHZ一组两个32位通道比,四组对半是两组四个通道的128位.只是比较读写,同样减去一半.HBM2 1024位是可以达到HBM1 2048位HBM2制程延迟应该是增强的.达到8000M-9000M左右的显存读写,需要单颗1000M*2左右的频率相当于三组六个GDDR5.如果达到五位数13000左右的显存读写,需要1500M-2000M频率,只增不减.这个数据不准确,128位有6000M-7000M,显存1500M-1750.HBM2 1024位 750MHZ四位数6000M左右读写和RX560基本同级.https://post.smzdm.com/p/645051/ https://post.smzdm.com/p/537141/ RX470 五位数11190M.RX470D可能是9000-10000左右显存读写.http://www.pcgameshardware.de/Ra ... ockin-Test-1275428/ R7显卡,显存读写五位数13000-15000.https://post.smzdm.com/p/amm0mrld/ 像素和纹理,提高了些许,VEGA64和R7显存差距也不大.只能看以后是核心和显存同时改变还是HBM2-3频率提高再来和前者来对比判断瓶颈.

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-2 15:01:43 | 显示全部楼层
本帖最后由 冶天 于 2019-5-2 15:30 编辑

VEGA 12 如果高频或者超频或者更多CU,可能是强行提高SP计算.HBM2频率偏低,显存读写也自然不高,GPU 1280SP这个规模带宽不够.RX560系列7000M的带宽,流处理器不变.GPU频率提高,帧率还是稍微好一些.80-100帧,整合市场的便携本,平板大小手持类还是可以的.按照我前面说的7NM-5NM,4C8T,55W-90W整机.可能要到HBM3了.制程频率规模效率在前,提高最低上线,开发在后.如果同时具备这两点,市场前景会高.

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-2 15:26:25 | 显示全部楼层
本帖最后由 冶天 于 2019-5-3 10:54 编辑

我尽力了,大脑不够用了.话说回来,带宽对于内核设计和数据传输延迟反应时间有很大的作用.计算单元要如何去使用更高带宽,分配的更有效.可能有一种钳制关系存在,存储带宽限制内核,同带宽下内核没有用完.我不确定这个是否准确,更精准的是芯片内部的存储和外部存储也有某些电路软件类型来管理使用.https://www.chiphell.com/thread-1760174-1-1.html HBCC现在是否起作用,还是起作用的调节机制使用HBM2远近调整有负作用?NCU单元偏计算.https://www.ithome.com/html/digi/321751.htm HBM2频率不够,HBCC管理来控制.https://www.chiphell.com/thread-1939539-1-1.html 1500M的RX590用不完2000M-2250MHZ的显存?1700MGPU核心频率,同带宽下提高.换成GDDR6,GPU频率1.8G-2G?7NM不是内核改变,只是面积缩小,延迟是会继续降低,提高反应,超频极限等出来才知道.那这样就是说北极星的GF14NM-12NM的GPU频率用不完高频率显存?没有40组CU-50组CU,384位-512位.中间有缺口.HBM2频率没有到1.5G-2G,位宽也没有到4096位.http://tieba.baidu.com/p/5975480905?pn=2 RX590超频.AMD芯片的制程频率开始都不高,每次优化制程可以提高一些.VEGA12 RX560 显存不动的GPU同频测试可以比较,或许有些计算参考.2304SP 36CU,应该是可以快速生产,频率提高用工艺,规模和频率都较慢,很耽误上市时间,错过时机.https://book.2cto.com/201508/54635.html http://tieba.baidu.com/p/6038761827#

3329

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
114129
经验
10
贡献
32
发表于 2019-5-4 13:16:18 | 显示全部楼层
本帖最后由 冶天 于 2019-5-4 15:12 编辑

看AIDA64的GPGPU显存读写测试,128位的GDDR5都是5000-7000M左右,256位11000-13000M左右,HBM1为11000-12000左右,HBM2为13000左右.写入没有读取高稍低一些.那么猜想默认显存频率高低可能影响读写(不同厂家制程设计优化显存颗粒有差异),可能不怎么和GPU有关.复制或者其它计算性能图形性能和显存控制器,主频,架构内核,制程或许有关.更大规模,更低位宽或者更小规模又是更大位宽,瓶颈区目前情况没法直接判断.GDDR5-GDDR6 128位-256位或许可以支持20多组CU,但需要提高显存频率满足纹理贴图光照,显存频率和显存控制器有密切关联.顶点模型三角形和几何生成和统一渲染的流处理器有关.R9 290X 512位 1250M 390X 1500M RX590 2000M-2250M.GDDR5实际没提升太多,架构或许SP CU 缓存寄存器没怎么变,周边单元分配模式制程和频率提高,温度功耗下降,能耗比效率上去.游戏有频率要求或者架构规模的,需要方式不同.那么假设这个存在,中低端可以提高显存频率和GPU频率,高端以上要开发规和优化模架构能运算的图形.打个比方RX560 16CU 1024SP 1.8G-2G GDDR5 1500M或者1.5G-1.6G 2000M 测试纹理贴图 适合哪种,顶点生成还是纹理贴图,不同方案需要不同种类.两个频率都高都可以测,就没有不对等的差异来看真实状态.有的数据不一定进L2缓存和显存控制器显存,如果在L1缓存寄存器逻辑调度影响帧生成延迟,内部使用和优化没有跟上.这个比较不合理,GDDR5厂商只给1500M-1600M.GPU可以用1.3G-1.8G来测试需要频率还是显存,也已经完全优化过架构的游戏.

61

主题

2003

帖子

2万

积分

Vega10

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

精华
1
金币
18885
经验
10
贡献
0
发表于 2019-5-19 16:52:13 | 显示全部楼层
又内鬼 终止交易

7

主题

130

帖子

4972

积分

R580

Rank: 6Rank: 6

精华
0
金币
3812
经验
10
贡献
10
 楼主| 发表于 2019-5-20 13:06:17 | 显示全部楼层
冶天 发表于 2019-5-4 13:16
看AIDA64的GPGPU显存读写测试,128位的GDDR5都是5000-7000M左右,256位11000-13000M左右,HBM1为11000-12000左 ...

是的我也不是专业人士不好验证瓶颈所在,哈哈我甚至都不知道的自己这几个简单测试是否严谨,我自己手上有的样品数量也是不多,很多都还不能正常使用。
这张卡目前从bios里得到描述是:
Vega12 A0 Falcon XTA SLT D20101 4GB 700E/750M 0.8V
游戏也确实侧重点不同,主要是没有合适的比对对象,不然大致说明一定的问题还是可以的。AIDA64那个读写的话还是挺奇葩的,不是很清楚哪方面对这个影响比较大,也许是我使用的版本比较老....待以后再详细测试。

7

主题

130

帖子

4972

积分

R580

Rank: 6Rank: 6

精华
0
金币
3812
经验
10
贡献
10
 楼主| 发表于 2019-5-20 13:06:33 | 显示全部楼层
Freedom 发表于 2019-5-19 16:52
又内鬼 终止交易

已终止

7

主题

130

帖子

4972

积分

R580

Rank: 6Rank: 6

精华
0
金币
3812
经验
10
贡献
10
 楼主| 发表于 2019-5-20 13:12:30 | 显示全部楼层
冶天 发表于 2019-5-2 15:26
我尽力了,大脑不够用了.话说回来,带宽对于内核设计和数据传输延迟反应时间有很大的作用.计算单元 ...

另外请教一下 VEGA 64 ES有没有办法装上正式版驱动?原bios正常步骤装的话装到一半会蓝屏,显示THREAD_STUCK_IN_DEVICE_DRIVER。试过刷正式版显卡bios,可以正常装完驱动但是无法驱动,似乎没有识别出来,最后是刷8GB版 FE bios,可以正常驱动可以正常显示,但是花屏....折腾了几天没弄好
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表