近期,MIT举办的“拓展计算机视野”系列讲座中,在“深度学习日”邀请了何凯明博士就生成模型这一主题发表演讲,我看了演讲视频[1]后,对主要内容进行了一个梳理,主要包括三个部分:生成模型概念、生成模型方法、生成模型的现实应用。 首先,何凯明博士以生成式AI技术在现代社会中的渗透性为脉络,通过聊天机器人
HuggingFace网站是一个人工智能学习的资源库,收集了包括计算机视觉、自然语言处理、语音处理、多模态、等多种任务的模型、数据集,国内外科研人员经常通过此网站下载所需的模型或数据集来开展工作。网站提供了git命令实现Linux系统打包下载,但是国内用户更多使用Windows系统,对我而言,一般也
DeepGEMM(Deep General Matrix Multiplication)是DeepSeek公司最新开源的通用矩阵乘法运算库,其主要目的是提高GPU的浮点运算效率。众所周知,深度学习中最重要的运算之一就是矩阵乘法,不管是前向传播还是反向传播都涉及。GPU对于数据运算的精度主要包括FP6