小樱 发表于 2019/5/25 03:37

avx2指令集对比1060 nvenc速度,GPU显卡编码压制不支持2个以上任务并行?







1050-1080是一模一样的性能,20系列听说提高了30%的效率,我没买过20系列显卡没办法测
1650是和10系列一样,被阉割了,1660 1660ti 2060 2070 2080都属于20系列,相同系列没有性能差距
显卡可以用同时处理两个任务,第三个任务会被显卡返回错误,无法进行开始
对比CPU来说,大概是10-15倍提升,所以,一个双路e5都比不过一张显卡

8400处理器的速度,60fps左右,这还是有avx2指令集的加持下,可想而知x79的e5没有avx2会有多慢了吧。
1060显卡可以达到了惊人的270fps,并且此时没没有吃满显卡性能,可以进行多开操作,同时显卡也支持2个任务并行,双任务跑满接近500fps,达到了对比CPU有了10倍的提升
cpu和显卡预设均使用了medium 1080p模式。
一张1050显卡才多少钱,成本就可以低很多了,优酷,哔哩哔哩等大企业都采用了显卡进行转码,省了很多买转码机的钱。
测试用的是medium,如果是slow,差距就更加明显了,可以达到15倍的提升!!!
转码对显存没有要求,看到占用了1.3G显存,因为是我后台缩小开了个模拟器呢,双任务并行状态,程序总共只占用了300M显存而已。
1050显卡下满载最大75W,无需外置供电,服务器主板可以插满6张,棒棒哒!直接Linux ffmpeg开跑就行,等于可以同时处理12个视频的效率。
不然优酷,哔哩哔哩都换显卡转码干嘛
http://trac.ffmpeg.org/wiki/HWAccelIntro

Tesla P100专业卡,感觉是坑傻逼的,别人发的评测
https://devtalk.nvidia.com/default/topic/1026438/gpu-accelerated-libraries/difference-in-performace-for-parallell-decode-encode-with-ffmpeg-h264_cuvid-and-h264_nvenc-tesla-p100/

家庭卡1060等,仅有2个并行,第3个任务会提示找不到nvenc编码器,听大佬说Linux下可以破解这个限制
Stream mapping:
Stream #0:0 -> #0:0 (h264 (native) -> h264 (h264_nvenc))
Stream #0:1 -> #0:1 (aac (native) -> aac (libfdk_aac))
OpenEncodeSessionEx failed: out of memory (10)
No NVENC capable devices found
Error initializing output stream 0:0 -- Error while opening encoder for output stream #0:0 - maybe incorrect parameters such as bit_rate, rate, width or height
Conversion failed!

解决:http://bbs.itzmx.com/thread-94377-1-1.html

otacat 发表于 2020/5/16 07:34

感觉跟AVX2关系不大,我用X99的E5V3试过,一样速度上不去,1080P的1.5X到头了

sky4726 发表于 2020/7/18 17:33

1650s图灵很香

xtellaris 发表于 2020/7/21 16:47

表示显卡转码真的香
页: [1]
查看完整版本: avx2指令集对比1060 nvenc速度,GPU显卡编码压制不支持2个以上任务并行?