1.实验成立时间及研究方向
实验室成立于2013年9月,主要从事藏文信息处理与机器翻译的科学研究工作。
2.研发团队人员结构,研发条件
目前有30名固定研究人员,其中高级职称者28名,中级职称者2名。计算机专业人员27名,藏语言专业3名。有博士学位的18名,其余的具有硕士学位。实验室除了固定研究人员之外,还有多名兼职研究人员,兼职人员主要指访问学者、实验室开放课题获得者和按科研需求临时雇用的人员。研发条件:(1)实验室建设规模:进一步扩大了实验室面积,积极投入,使得实验室面积达到1500平方米,实验室各种仪器设备原值达1000万元。(2)藏文信息处理平台建设:本实验室在依托青海师范大学藏文信息研究中心和藏文信息处理教育部重点实验室的基础上,已初步建立藏文信息处理平台,确保根据实验室自己的研究特色,开展藏文信息处理和机器翻译的研究工作。(3)图书资料和网络资源建设:购置了常用中外文期刊库,加强专业资料是建设。(4)仪器设备建设:依托青海师范大学藏文信息研究中心和藏文信息处理教育部重点实验室重点建设了藏文文字识别和语音识别实验室建设,已购置文字识别和语音识别设备。
3.获得的项目资助情况
项目建设以来承担科研项目23项,其中国家自然科学基金项目11项,国家社会科学基金3项,青海省科技厅项目3项、春晖项目1项,共计项目经费824万元(见表1)。
表1立项情况表(印证材料见附件1)
序号 |
课题名称 |
编号 |
负责人 |
起止时间 |
经费 (万元) |
类别 |
1 |
现代藏语虚词库的构建研究 |
Z2017053 |
索南才让 |
2018-2020 |
3 |
教育部春晖计划 |
2 |
复杂超网络的拓扑指标及其在社团检测中的应用研究 |
2018-ZJ-718 |
李发旭 |
2018—2021 |
35 |
青海省自然基金项目 |
3 |
青海耐氧基因EGLN1多态性和原发性高血压的关系研究 |
2018-ZJ-776 |
宋长新 |
2018—2021 |
45 |
国家社科基金项目 |
4 |
藏文文献资源数字化技术集成与应用示范 |
2017YFB1402200 |
才让加 |
2018-2020 |
50 |
国家重点研发计划(参与) |
5 |
基于深度学习的藏语向量表示方法研究 |
F060401 |
才智杰 |
2019—2022 |
41 |
国家自然基金 |
6 |
K-哈密尔顿连同与K-边哈密尔顿连同问题的研究 |
A011602 |
尹俊 |
2019-2021 |
26 |
国家自然基金 |
7 |
有向图能量的极值问题研究 |
11701311 |
邓波 |
2018-2021 |
24 |
国家自然科学基金项目 |
8 |
多层复杂网络的抗毁性及其应用研究 |
61763041 |
肖玉芝 |
2018-2021 |
40 |
国家自然科学基金项目 |
9 |
基于语料库的《八大藏戏》词汇研究 |
17XYY030 |
索南才让 |
2018-2020 |
20 |
国家社科基金项目 |
10 |
藏传佛教语言的厘定、规范及其历史意义研究( |
17BYY176 |
索南东主 |
2018-2020 |
20 |
国家社科基金项目 |
11 |
互联网+藏语信息处理平台建设项目 |
2017-GX-146 |
华却才让 |
2017-2019 |
200 |
青海省省级财政科技专项 |
12 |
哈密尔顿相关结构图及其应用研究 |
2017-ZJ-949Q |
尹君 |
2017-2019 |
20 |
青海省省级财政科技专项 |
13 |
基于复杂网络的藏文基本单位统计特征研究 |
2017-ZJ-767 |
才智杰 |
2017-2019 |
35 |
青海省省级财政科技专项 |
14 |
基于超图理论的超网络相继故障及应用研究 |
61603206 |
马秀娟 |
2017-2019 |
20 |
国家社科基金项目 |
15 |
点边失效下网络的混合可靠度研究 |
11661069 |
赵海兴 |
2017-2020 |
40 |
国家自然科学基金项目 |
16 |
基于融合策略的汉藏(藏汉)机器翻译关键技术研究 |
61662061 |
才让加 |
2017-2020 |
41 |
国家自然科学基金项目 |
17 |
非均匀超网络模型构建及特性研究 |
61663041 |
胡枫 |
2017-2020 |
41 |
国家自然科学基金项目 |
18 |
先验信息与图论相结合的图像分割方法及其应用研究 |
61662062 |
辛月兰 |
2017-2020 |
41 |
国家自然科学基金项目 |
19 |
藏族谚语信息化资源库建设 |
16BYY167 |
才让卓玛 |
2017-2019 |
20 |
国家社科基金项目 |
20 |
基于数据驱动的藏语语音合成技术研究 |
22016077 |
才让卓玛 |
2017-2018 |
2 |
春晖计划 |
21 |
基于超图理论的超网络相继故障及应用研究 |
61603206 |
马秀娟 |
2016-2019 |
20 |
国家自然科学基金项目 |
22 |
藏语组块分析关键技术研究及组块库构建 |
61550004 |
李琳 |
2016-2018 |
15 |
国家自然科学基金项目 |
23 |
藏历算法模型及其自动推算系统研究 |
61550006 |
才藏太 |
2016-2018 |
25 |
国家自然科学基金项目 |
合计:860万元 |
4.项目结项
项目建设以来科研项目结项共10项,其中国家自然科学基金项目2项,国家社科基金项目1项,青海省科技厅项目1项。(见表2)
表2结项情况表(印证材料见附件2)
序号 |
课题名称 |
编号 |
负责人 |
结项时间 |
类别 |
备注 |
1 |
复杂网络抗毁性及其在三江源生态监测中的应用研究 |
2014-ZJ-721 |
肖玉芝 |
2017.12 |
青海省自然基金项目 |
主持 |
2 |
吐蕃时期古藏文词汇研究 |
13YJC740077 |
索南才让 |
2018.5 |
教育部人文科学研究项目 |
参与 |
3 |
面向自然语言处理的藏文句型自动分析及分布统计 |
13BYY141 |
才智杰 |
2018.3 |
国家社会科学基金 |
主持 |
4 |
基于树到串藏语句法翻译 若干关键技术研究 |
1363055 |
华却才让 |
2018.3 |
国家自然科学基金 |
主持 |
5 |
基于多策略融合技术的藏语动词短语自动识别研究 |
2015-ZJ-923Q |
赵维纳 |
2018.5 |
青海省自然科学基金青年项目 |
主持 |
6 |
中国大百科全书-物理学(藏文版) |
11365016 |
公报拉旦 |
2018.3 |
国家自然科学基金 |
主持 |
7 |
高原藏族人HIF1A基因多态性同地域性高血压的关系研究 |
2014—ZJ-724 |
宋长新 |
2017 |
青海省自然基金项目 |
|
8 |
复杂网络抗毁性及其应用研究 |
61440005 |
肖玉芝 |
2016 |
国家自然科学基金项目 |
|
9 |
藏语音素拼读法文语转换技术研究 |
61262051 |
才让卓玛 |
2017 |
国家社科基金项目 |
|
10 |
面向自然语言处理的藏语虚词研究 |
20161233 |
索南才让 |
2016 |
国家社科基金项目 |
|
合计 |
|
|
5.科技成果
序号 |
完成人姓名 |
成果名称 |
鉴定部门 |
鉴定日期 |
鉴定结论 |
鉴定号 |
1 |
肖玉芝 |
复杂网络抗毁性及其在三江源生态监测中的应用研究 |
青海省科技厅 |
2018.03 |
国内领先 |
26344981 |
2 |
宋长新 |
青海地区藏族人低氧适应HIF1A和VHL的单核苷酸多态性特征分析及数据库构建 |
青海省科技厅 |
2018.6 |
国际先进 |
26350317 |
3 |
宋长新 |
青海地区藏族人HIF1A基因多态性对若干基因调控的影响及其和高原高血压的关系研究 |
青海省科技厅 |
2018.6 |
国内先进 |
26350316 |
4 |
宋长新 |
高原藏族人HIF1A基因多态性同地域性高血压关系研究 |
青海省科技厅 |
2018.6 |
国内先进 |
26350275 |
6.论文
发表论文37篇,其中SCI/EI 20篇,中文核心期刊发表13篇(印证材料见附件4);
序号 |
作者姓名 |
论文名称 |
期刊名称 |
论文层次 |
发表日期 |
1 |
肖玉芝 |
基于多层复杂网络的微信用户行为分析 |
青海师范大学 |
一般 |
2017.12 |
2 |
索南才让 |
基于语料库的藏语语序结构研究 |
中国藏学 |
核心 |
2018.2 |
3 |
华却才让 |
基于混合策略的藏文人称代词指代消解研究 |
计算机工程与应用 |
核心 |
2018.5 |
4 |
华却才让 |
基于有限状态自动机阿拉伯数字与藏文数词自动翻译 |
计算机工程与科学 |
核心 |
2018.3 |
5 |
马秀娟 |
Cascading failures of k uniform hyper-network based on the hyper adjacent matrix |
PhysicaA |
SCI |
2018.7 |
6 |
才让加 |
基于Naive Bayes的藏文人名性别自动识别 |
青海师范大学学报 |
一般 |
2017.12 |
7 |
柔特 |
基于语序变换的藏文复述句生成方法 |
计 算 机 工 程 |
核心 |
2018.4 |
8 |
才让加 |
基于最大熵和HMM藏文新词识别对比研究 |
青海师范大学学报 |
一般 |
2018.3 |
9 |
才让加 |
藏 文音节拼写检查的N CNN模型 |
中文信息学报 |
核心 |
已录用 |
10 |
才让加 |
注意力的端到端 模型生成藏文律诗 |
第十七届中国计算语言学学术会议 |
会议 |
已录用 |
11 |
周毛先 |
A Study on Machine Translation-oriented Parallel Corpus Construction Tech- niques for Tibetan, Chinese and English |
LAP LAMBERT Academic Publishing |
会议 |
已录用 |
12 |
才藏太 |
面向语言信息处理的藏语短语及其分类方法研究 |
中文信息学报 |
核心 |
已录用 |
13 |
赵海兴 |
Syntactic word embedding based on dependency syntax and polysemous analysis |
Frontiers of Information Technology & Electronic of Engineering |
SCI |
2018.4 |
14 |
赵海兴 |
确定性均匀递归树的谱分析 |
电子设计工程 |
核心 |
2018.4 |
15 |
赵海兴 |
几类图的推广的拉普拉斯矩阵的特征多项式 |
应用数学进展 |
一般 |
2017.9 |
16 |
赵海兴 |
基于多视图集成的网络表示学习算法 |
计算机科学 |
核心 |
已录用 |
17 |
赵海兴 |
基于描述约束的词表示学习 |
中文信息学报 |
核心 |
已录用 |
18 |
赵海兴 |
Network Representation Learning based on Community and Text Features |
第十七届中国计算语言学学术会议 |
会议 |
已录用 |
19 |
SCI |
Syntactic word embedding based ondependency syntax and polysemous analysis |
赵海兴 |
FITEE |
2095-9184 |
20 |
SCI |
Text-Associated Max-Margin DeepWalk |
赵海兴 |
FITEE |
2095-9184 |
21 |
SCI |
Trees with large numbers of subtrees |
肖玉芝 |
International Journal of Computer Mathematics |
0020-7160 |
22 |
SCI |
On the matching polynomial of hypergraphs |
赵海兴 |
International Journal of Computer Mathematics |
2020-7160 |
23 |
SCI |
Processing of the Affixes in Tibetan Word Segmentation |
华却才让 |
会议 |
|
24 |
SCI |
A Tibetan input method for mobile intelligent devices |
黄鹤鸣 |
会议 |
|
25 |
SCI |
The Research on Cascading Failure of Farey Network |
Xiujuan Ma |
会议 |
|
26 |
CSSCI |
超网络的无标度特性研究 |
胡枫 |
中国科学 |
47, 060501 (2017 ) |
27 |
CSSCI |
藏文复合句的依存句法分析 |
华却才让 |
中文信息学报 |
第30卷 第6期 |
28 |
CSSCI |
基于语料库的藏语语音合成单元选择算法 |
才让卓玛 |
中文信息学报 |
第31卷 第5期 |
29 |
CSSCI |
几类复杂网络的节点乘积度分布 |
马秀娟 |
青海师范大学学报 |
2017年第1期 |
30 |
CSSCI |
几类图的推广的拉普拉斯矩阵的特征多项式 |
赵海兴 |
理论数学 |
|
31 |
|
基于词向量的藏语句子相似度计算 |
周毛先 |
会议 |
|
32 |
CSSCI |
基于云平台的C语言课程的敏捷教学实践 |
宋长新 |
高教专区 |
47, 060501 (2017 ) |
33 |
CSSCI |
基于超图的超网络相继故障分析 |
马秀娟 |
物理学报 |
2016(8) |
34 |
CSSCI |
基于多投影的脱机手写藏文字符特征提取方法 |
黄鹤鸣 |
计算机技术与发展 |
201602 |
35 |
CSSCI |
基于锚点信息和句子长度相结合的汉藏句子对齐方法研究 |
才藏太 |
青海师范大学学报 |
201601 |
36 |
SCI |
A small-world network derived from the deterministic uniform recursive tree by line graph operation |
赵海兴 |
理论数学 |
201607 |
37 |
CSSCI |
故藏文中的虚词研究 |
索南才让 |
西藏大学学报 |
201608 |
7.论著(包括著作、软著、国家标准)
序号 |
作者姓名 |
著作名称 |
出版单位 |
出版时间 |
著作类别 |
1 |
才让卓玛 |
藏文音素拼读法文语转换系统 |
中华人民共和国国家版权局 |
2018.5 |
软件著作权 |
2 |
才让卓玛 |
藏语常用语自动抽取系统 |
中华人民共和国国家版权局 |
2018.3 |
软件著作权 |
3 |
吉太加 |
藏语水平等级测试考试大纲(一级) |
国家民族出版社 |
20017.12 |
著作 |
4 |
吉太加 |
藏语水平等级测试考试大纲(二级) |
国家民族出版社 |
20017.12 |
著作 |
5 |
吉太加 |
藏语水平等级测试考试大纲(三级) |
国家民族出版社 |
20017.12 |
著作 |
6 |
吉太加 |
藏语水平等级测试考试大纲(四级) |
国家民族出版社 |
20017.12 |
著作 |
7 |
黄鹤鸣 |
信息技术 藏文字符排序规范 |
国家标准管理委员会 |
2018.6 |
国家标准 |
8 |
公报拉旦 |
大学物理学 |
中国藏学出版社 |
2017.12 |
著作 |
9 |
华却才让 |
藏文Wylie拉丁自动转写系统 |
中华人民共和国国家版权局 |
2017 |
软件著作权 |
10 |
华却才让 |
藏文半自动依存句法标注系统 |
中华人民共和国国家版权局 |
2017 |
软件著作权 |
11 |
才智杰 |
藏语句型结构分布统计系统 |
中华人民共和国国家版权局 |
2017 |
软件著作权 |
12 |
才智杰 |
藏语词位及分词标注转换系统 |
中华人民共和国国家版权局 |
2017 |
软件著作权 |
13 |
宋长新 |
构建基于WEB的高血压相关基因异常表达数据库及生物信息分析平台 |
中华人民共和国国家版权局 |
2017 |
软件著作权 |
14 |
宋长新 |
一种生物体内信息获取装置 |
中华人民共和国国家版权局 |
2017 |
发明专利 |
15 |
宋长新 |
一种带有短信功能的血压计 |
中华人民共和国国家版权局 |
2017 |
发明专利 |
16 |
宋长新 |
一种理疗信息采集装置 |
中华人民共和国国家版权局 |
2017 |
发明专利 |
17 |
宋长新 |
高原缺氧诱发高血压发生的分析方法 |
|
2017 |
发明专利 |
8.获奖成果
获奖者姓名 |
成果名称 |
奖项名称 |
发奖单位 |
奖励级别 |
获奖等级 |
肖玉芝 |
全国青年科普创新实验暨作品大赛 |
优秀指导教师 |
中国科协科普部 |
西年赛区 |
一等奖 |
马秀娟 |
Controllability of deterministic Networks withthe Identical Degree Sequence |
青海省自然科学优秀学术论文 |
青海省人民政府 |
省级 |
二等 |
李发旭 |
On the Estrada index of cactus graphs |
青海省自然科学优秀学术论文 |
青海省人民政府 |
省级 |
三等 |
吉太加 |
藏语句法研究 |
中国藏学研究珠峰奖 |
中央统战部 |
国家级 |
一等奖 |
宋长新 |
第九届全国蓝桥杯软件与信息技术程序设计大赛青海赛区 |
优秀指导教师 |
工业和信息化部 |
省级 |
二等奖 |
胡枫 |
第九届全国蓝桥杯软件与信息技术程序设计大赛全国总决赛 |
优秀指导教师 |
工业和信息化部 |
国家级 |
二等奖 |
胡枫 |
第九届全国蓝桥杯软件与信息技术程序设计大赛全国总决赛 |
优秀指导教师 |
工业和信息化部 |
国家级 |
三等奖 |
胡枫 |
第九届全国蓝桥杯软件与信息技术程序设计大赛全国总决赛 |
优秀指导教师 |
工业和信息化部 |
国家级 |
优秀奖 |
才让卓玛等 |
藏语语音合成系统的设计与实现 |
论文 |
青海省人民政府 |
省级 |
优秀 |
肖玉芝 |
New method for counting the number of spanning trees in a two-tree network |
论文 |
青海省人民政府 |
省级 |
二等 |
宋长新 |
中国侨联新侨创新创业活动 |
优秀指导教师 |
青海省人民政府 |
部级 |
优秀 |
宋长新 |
C\C++程序设计 |
优秀指导教师 |
青海省人民政府 |
省级 |
优秀指导教师 |
胡枫 |
C\C++程序设计 |
优秀指导教师 |
青海省人民政府 |
省级 |
优秀指导教师 |
才让加、华果才让等 |
全国互联网+创新创业大赛总决赛 |
优秀指导教师 |
工业和信息化部 |
国家级 |
银奖 |
9.学术会议
组织者(参与者)姓名 |
会议名称 |
地点 |
时间 |
国际/国内 |
备注 |
马秀娟,尹君 |
2018年第十四届中国网络科学论坛 |
东南大学 |
2018年5月 |
国内 |
参加 |
索南才让 |
藏语语言学会议 |
上海师范大学 |
2018.7 |
国内 |
参加 |
赵海兴 |
图论,人工智能与复杂网络国际研讨会 |
青海师范大学 |
2018.7 |
国际 |
组织 |
柔特 |
第七届全国少数民族自然语言处理青年论坛 |
内蒙古师范大学 |
2018.7 |
国内 |
参加 |
10、主要研发人员及工作任务。例表如下:
排序 |
姓名 |
工作单位 |
职称 |
工作任务 |
1 |
赵海兴 |
青海师范大学 |
高级 |
项目负责 |
2 |
黄鹤鸣 |
青海师范大学 |
高级 |
模式识别研究 |
3 |
才智杰 |
青海师范大学 |
高级 |
藏语语言识别研究 |
4 |
华却才让 |
青海师范大学 |
副高级 |
藏语语言识别研究 |
5 |
才藏太 |
青海师范大学 |
副高级 |
藏语语音语料库建设 |
6 |
柔特 |
青海师范大学 |
副高级 |
藏语语音语料库建设 |
7 |
索南才让 |
青海师范大学 |
副高级 |
藏语语音语料库建设 |
8 |
头旦才让 |
青海师范大学 |
中级 |
语音标注研究 |
9 |
周毛先 |
青海师范大学 |
中级 |
语音标注研究 |
10 |
才让加 |
青海师范大学 |
高级 |
项目负责与协调 |
11 |
韩维良 |
青海师范大学 |
高级 |
模式识别 |
12 |
赵虎 |
青海师范大学 |
副高级 |
复杂网络 |
13 |
李发旭 |
青海师范大学 |
副高级 |
舆情分析 |
14 |
卢文 |
青海师范大学 |
副高级 |
复杂网络 |
15 |
宋长新 |
青海师范大学 |
高级 |
数据挖掘 |
16 |
才让卓玛 |
青海师范大学 |
高级 |
语音识别 |
17 |
胡枫 |
青海师范大学 |
高级 |
复杂网络 |
18 |
赵维纳 |
青海师范大学 |
副高级 |
模式识别 |
19 |
肖玉芝 |
青海师范大学 |
副高级 |
复杂网络 |
20 |
马秀娟 |
青海师范大学 |
副高级 |
复杂网络 |
21 |
李琳 |
青海师范大学 |
副高级 |
模式识别 |
22 |
尹君 |
青海师范大学 |
副高级 |
模式识别 |
23 |
李峰 |
青海师范大学 |
副高级 |
复杂网络 |
24 |
王小红 |
青海师范大学 |
副高级 |
研究人员 |
25 |
孙茂松 |
清华大学 |
高级 |
信息处理 |
26 |
邓波 |
青海师范大学 |
副高级 |
藏语言 |
27 |
王新辉 |
青海师范大学 |
副高级 |
藏语言 |
28 |
公保拉旦 |
青海师范大学 |
高级 |
藏语言 |
29 |
吉太加 |
青海师范大学 |
高级 |
藏语言 |
30 |
索南东主 |
青海师范大学 |
高级 |
藏语言 |
11.人才培养情况。
培养了1名省级高校青年骨干教师,培养青海省“高端创新人才”人才6名,青海省“135高层次人才培养工程”4名,培养团队“青海师范大学藏文信息处理与机器翻译创新团队”,新遴选博士/硕士研究生导师5人,培养博士5人、硕士39人,招收博士研究生20人,硕士研究生50人。