资讯
早在1998年7月,《现代汉语常用词表》研制项目启动,这是一个庞杂而艰难的项目,由国家语言文字工作委员会组织实施。该词表是作为国家已经 ...
机器之心报道编辑:赵阳本文初步探讨了不同类型的词表对语言模型训练所产生的影响,研究者使用了 12 个小型的语言模型及 4 个中型的语言模型 ...
近日,词表类工具书《现代汉语常用词表》(第2版)正式出版,该书共收录现当代社会生活中比较稳定的、使用频率较高的56790个词。该书由语文出版社原社长李行健、厦门大学嘉庚学院教授苏新春共同主编。
常用词表诞生历时10年 早在1998年7月,《现代汉语常用词表》研制项目启动,这是一个庞杂而艰难的项目,由国家语言文字工作委员会组织实施。
词表中所呈现的手语动作,要求是在公务活动、学校教育、电视媒体、图书出版、公共服务、信息处理等场合或领域以及今后在国家举行的手语水平 ...
本研究通过训练包含不同词表配置的模型(参数范围从 33M 到 3B,字符数最多 500B),提出了三种方法来预测计算最优的词表大小:基于 FLOPs 的 ...
《词表》还将词语按词汇学习中的难易、深浅和先后次序分为四级,分别对应义务教育阶段的四个学段。 具体对应关系为:1级,对应第一学段(小学一、二年级);2级,对应第二学段(小学三、四年级);3级,对应第三学段(小学五、六年级);4级,对应第四学段(初中一至三年级)。
同时他们将词表扩展到无穷大,增大了Image tokenizer的表示空间,大大提高了自回归文生图的上限。 他们还将模型大小扩展到20B。
本文发现,模型中的非词表参数 指的是词表大小。 。实证结果与我们所提出的 3 种预测最优词表大小的方法的结果基本一致。其中较大的圆圈表示 ...
而结构感知词表通过将蛋白质结构编码成一维的结构序列,在尽可能保留结构模式的情况下忽略了精细的坐标数值,因此模型能够有效地利用结构 ...
近日,《国家通用手语常用词表》和《国家通用盲文方案》由国家语言文字工作委员会规范标准审定委员会审定,经教育部、国家语言文字工作委员会、中国残疾人联合会同意,作为语言文字规范发布,自2018年7月1日起实施。
在一个数据库的索引中,叙词表可以帮助用户选择用词,以便检索到最大数目的相关文献。叙词表用来对出版物的内容进行一致的、全面的和简明的 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果