滚动新闻:
首页 > 客户服务 > 技术支持
技术支持
相关GPU产品
相关解决方案
相关应用案例
专业图形显卡与普通游戏显卡的区别
  专业图形卡一直以来给许多人的印象都是相当神秘的,每每谈起,无不肃然起敬以顶礼膜拜之状。但是说到要弄清楚专业卡的底细,倒也并不十分难,专业图形卡的英文是profe[ 查看详细 ]
什么是GPU实时渲染?
  GPU渲染是利用图形处理芯片进行渲染运算的最新技术,与传统的CPU渲染不同,GPU渲染的运算速度更快,传统的CPU渲染是利用CPU的运算部分进行渲染运算,但一颗CPU的运算单[ 查看详细 ]
KEPLER 架构详解
  KEPLER - 全球最快的高性能计算架构  NVIDIA® Kepler 是全球最快、最高效的高性能计算(HPC)架构。凭借该架构,用户可实现3倍的性能。 由于具备诸多创新的计算技[ 查看详细 ]
Quadro Mosaic多显示器技术介绍
  无论是想要在 8 台显示器上还是在 4K 投影仪上查看自己的设计理念,用户都可以运用NVIDIA® Mosaic™ 多显示器技术。 该技术包含于 NVIDIA® Quadro®[ 查看详细 ]
Maximus 技术介绍
  最新的 NVIDIA® Maximus™ 配置基于 NVIDIA Kepler 架构,该架构是全球最快、最高效的视觉计算架构。 这一先进的技术可同时进行 3D 设计、模拟以及可视化,[ 查看详细 ]
CUDA技术介绍
  CUDA™ 是 NVIDIA® 公司的并行计算架构。 该架构通过利用 GPU 的处理能力,可大幅提升计算性能。  目前为止基于 CUDA 的 GPU 销量已达数以百万计,软件开发[ 查看详细 ]
CUDA的Threading:Block和Grid设定
硬件基本架构  实际上在 nVidia 的 GPU 里,最基本的处理单元是所谓的 SP(Streaming Processor),而一颗 nVidia 的 GPU 里,会有非常多的 SP 可以同时做计算;而数个 SP 会在附加一些其他单元,一起组成一个[ 查看详细 ]
CUDA程序优化的15个策略
1. memory coalescing,保证内存融合。因为global memory在CC为1.x上是按照half wrap进行访问读写的,而在2.x上是按照wrap进行访问读写的。在显存中,有多个存储器控制器,负责对显存的读写,因此,一定要注意存储器[ 查看详细 ]
Ubuntu环境下的CUDA编程(二)
一:运行程序  按照上一篇文章所述,安装好cuda软件以后,就可以使用”nvcc -V“命令查看所用到的编译器版本,本人用版本信息来自:“Cuda compilation tools, release 3.2, V0.2.1221”。  [ 查看详细 ]
Ubuntu环境下的CUDA编程(一)
1、更新Ubuntu软件:  #sudo apt-get install biuld-essential  #sodu apt-get update2、下载CUDA安装软件:  到http://developer.nvidia.com/cuda-toolkit-32-downloads下载三个软件:CUDA driver,toolkit和[ 查看详细 ]
Ubuntu环境下的CUDA编程(三)
一、出现了 shared data 过多的现象  在编译的时候,Kernel调用的那一行报错,说是用了过多的 share data,程序出错,本来以为时参数过多,后来才发现,计算的时候不小心将每个 block 里面 shared data 分配[ 查看详细 ]
【CUDA】OpenACC 问与答
问:OpenACC的API是什么?答: OpenACC API允许并行编程人员提供简单的提示——被称为“指令”给编译器,识别代码要加速的哪些区域,而不需要程序员修改底层代码。通过将并行部分告诉给编译器,指[ 查看详细 ]
【CUDA】CUDA Toolkit 4.1 RC1 新增LLVM编译器
2011年11月10日,据NVIDIA官方宣布CUDA Toolkit 4.1 RC1版本发布,目前CUDA注册开发者已经可以下载。新版本包括一款新的基于LLVM的CUDA编译器,超过一千项新的图像处理功能,以及经过重新设计的具有自动性能[ 查看详细 ]
Ubuntu环境下的CUDA编程(四)
近来测试了矩阵(规模为2048*2048)乘法在不同参数下两个算法分别使用的时间:第一个算法为没有使用shared memory的直接相乘,每个thread负责矩阵C的一个元素的计算;第二个算法为使用了shared memory的分块算法,每个b[ 查看详细 ]
【CUDA】CUDA编程接口:纹理存储器的参考属性
本文将讲述CUDA编程接口中关于纹理存储器的基础知识,包括以下内容:纹理参考属性的相关概念、纹理参考的声明和运行时纹理参考属性。  相关阅读:  CUDA编程接口:虚拟地址空间与错误检查  CUDA编程接口:多设备[ 查看详细 ]
【CUDA】CUDA4.1 NVIDIA最新并行架构版本
英伟达公司2012年发布了CUDA并行计算平台的全新版本,该软件将适用于计算生物学家、化学家、物理学家、地球物理学家、其它研究人员以及工程师等诸多群体,让他们能够更轻松地利用GPU来推动模[ 查看详细 ]
开源编译器LLVM支持NVIDIA GPU
英伟达公司宣布,LLVM 现已支持英伟达 GPU,从而让更多的研究人员、独立软件供应商 (ISV) 以及编程语言能够利用 GPU 加速的优势。LLVM 是一款在业内极其流行的开源编译器。LLVM 是一种应用广泛的开源编译器架构,[ 查看详细 ]
GPU并行编程:内核及函数的实现
到现在为止,我们还没有真正触摸到了并行编程,这篇文章就是为此而写的。
▲图 1 并行中的内核  回想一下我们之前在设备上使用kernelFunction<<<1,1>>>(..)执行一个函数的代码,我在那里还曾说过[ 查看详细 ]
GPU计算光荣使命,Tesla K10及K20技术规格详解
在GTC 2012大会上,NVIDIA老总黄仁勋公布了新一代Tesla加速卡的详情,不过此次发布的Tesla显卡算是双胞胎,一款是基于双芯GK104架构的Tesla K10,另外一款则使用了真正的新架构,基于GK110核心的Tesla K20。
K10和[ 查看详细 ]
页次:1/1 每页25 总数19    首页  上一页  下一页  尾页    转到: