资讯

在荣获本届ACL最佳论文的4个团队中:DeepSeek团队(梁文锋参与撰写)和北京大学杨耀东团队各摘得一篇。另外两篇则分别归属CISPA 亥姆霍兹信息安全中心 & TCS Research & 微软团队以及斯坦福大学 & Cornell Tech团队。
目前,大语言模型的核心技术之一是 注意力机制(Attention) 。传统的全注意力机制在处理长文本时,计算量会随着文本长度的增加呈平方级增长,导致模型响应速度变慢,训练和推理成本高昂。例如,在 64k ...
2025年7月27日至8月1日,第63届 ACL(计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会论文接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半 ...
全球人工智能领域的顶级会议ACL 2025公布了其年度最佳论文奖。来自中国的DeepSeek-AI团队凭借其开创性研究 《Native Sparse Attention: Hardware-Aligned and Natively Trainable ...
继问鼎图像生成开源模型竞技场榜单后,智象未来(HiDream.ai)再创里程碑!其最新开源模型HiDream E1.1强势跻身Artificial Analysis图像编辑智能体榜单第一梯队,作为领先的开源图像编辑模型,其性能全面超越Flux.1 ...
值得注意的是,近日,DeepSeek也发布最新论文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》(《原生稀疏注意力:硬件对齐且可 ...
2月18日,DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告,论文主要内容是关于NSA(Natively Sparse Attention,原生稀疏注意力),官方介绍这是 ...
得益于思特威 AllPix ADAF 及 Sparse PDAF 技术,SC585XS 实现了各类光线条件下的 双模式自适应快速对焦能力。 在暗光场景下,SC585XS 可开启 AllPix ADAF 模式,通过 100% 全像素对焦,保障低光照下的高速抓拍成像。
sparse-attention 自适应的稀疏注意力,主要方法是在第一个Transformer层近似一个低秩的注意力分数矩阵,以此为依据构造掩码矩阵 ...
作者:量子位 编者按:激活稀疏性是解决大语言模型(LLMs)在推理阶段出现的计算成本高、内存占用大等问题的有效方法,可以有效减少激活张量中激活元素的数量。然而该方法无法实现 LLMs 激活的完全稀疏性,从而限制了推理阶段的效率提升。 对此,微软亚洲研究院提出 Q-Sparse 实现了 LLMs 激活 ...
编辑推荐: 近日,生物医学工程学院陈武凡、戚力团队在稀疏光声层析成像图像重建的研究取得新进展,在中国科学院一区学术期刊《Photoacoustics》发表了最新科研成果:Image reconstruction of multispectral sparse sampling photoacoustic tomography based on deep algorithm ...
央视网消息: 6月11日晚,吉林市公安局船营分局发布警情通报:6月10日11时49分,我分局接市公安局110派警指令称,吉林市船营区北山公园发生伤人案件。属地派出所民警迅速赶到现场,第一时间将伤者送医救治,迅速抓捕犯罪嫌疑人。经查,崔某某(男,55岁,吉林市龙潭区人)在北山公园走路时 ...