实验室科研

青海省藏文信息处理与机器翻译重点实验室近三年工作报告
发布时间:2018-09-12     浏览量:

1.实验成立时间及研究方向

实验室成立于2013年9月,主要从事藏文信息处理与机器翻译的科学研究工作。

2.研发团队人员结构,研发条件

目前有30名固定研究人员,其中高级职称者28名,中级职称者2名。计算机专业人员27名,藏语言专业3名。有博士学位的18名,其余的具有硕士学位。实验室除了固定研究人员之外,还有多名兼职研究人员,兼职人员主要指访问学者、实验室开放课题获得者和按科研需求临时雇用的人员。研发条件:(1)实验室建设规模:进一步扩大了实验室面积,积极投入,使得实验室面积达到1500平方米,实验室各种仪器设备原值达1000万元。(2)藏文信息处理平台建设:本实验室在依托青海师范大学藏文信息研究中心和藏文信息处理教育部重点实验室的基础上,已初步建立藏文信息处理平台,确保根据实验室自己的研究特色,开展藏文信息处理和机器翻译的研究工作。(3)图书资料和网络资源建设:购置了常用中外文期刊库,加强专业资料是建设。(4)仪器设备建设:依托青海师范大学藏文信息研究中心和藏文信息处理教育部重点实验室重点建设了藏文文字识别和语音识别实验室建设,已购置文字识别和语音识别设备。

3.获得的项目资助情况

项目建设以来承担科研项目23项,其中国家自然科学基金项目11项,国家社会科学基金3项,青海省科技厅项目3项、春晖项目1项,共计项目经费824万元(见表1)。表1立项情况表(印证材料见附件1)

序号

课题名称

编号

负责人

起止时间

经费

(万元)

类别

1

现代藏语虚词库的构建研究

Z2017053

索南才让

2018-2020

3

教育部春晖计划

2

复杂超网络的拓扑指标及其在社团检测中的应用研究

2018-ZJ-718

李发旭

2018—2021

35

青海省自然基金项目

3

青海耐氧基因EGLN1多态性和原发性高血压的关系研究

2018-ZJ-776

宋长新

2018—2021

45

国家社科基金项目

4

藏文文献资源数字化技术集成与应用示范

2017YFB1402200

才让加

2018-2020

50

国家重点研发计划(参与)

5

基于深度学习的藏语向量表示方法研究

F060401

才智杰

2019—2022

41

国家自然基金

6

K-哈密尔顿连同与K-边哈密尔顿连同问题的研究

A011602

尹俊

2019-2021

26

国家自然基金

7

有向图能量的极值问题研究

11701311

邓波

2018-2021

24

国家自然科学基金项目

8

多层复杂网络的抗毁性及其应用研究

61763041

肖玉芝

2018-2021

40

国家自然科学基金项目

9

基于语料库的《八大藏戏》词汇研究

17XYY030

索南才让

2018-2020

20

国家社科基金项目

10

藏传佛教语言的厘定、规范及其历史意义研究(

17BYY176

索南东主

2018-2020

20

国家社科基金项目

11

互联网+藏语信息处理平台建设项目

2017-GX-146

华却才让

2017-2019

200

青海省省级财政科技专项

12

哈密尔顿相关结构图及其应用研究

2017-ZJ-949Q

尹君

2017-2019

20

青海省省级财政科技专项

13

基于复杂网络的藏文基本单位统计特征研究

2017-ZJ-767

才智杰

2017-2019

35

青海省省级财政科技专项

14

基于超图理论的超网络相继故障及应用研究

61603206

马秀娟

2017-2019

20

国家社科基金项目

15

点边失效下网络的混合可靠度研究

11661069

赵海兴

2017-2020

40

国家自然科学基金项目

16

基于融合策略的汉藏(藏汉)机器翻译关键技术研究

61662061

才让加

2017-2020

41

国家自然科学基金项目

17

非均匀超网络模型构建及特性研究

61663041

胡枫

2017-2020

41

国家自然科学基金项目

18

先验信息与图论相结合的图像分割方法及其应用研究

61662062

辛月兰

2017-2020

41

国家自然科学基金项目

19

藏族谚语信息化资源库建设

16BYY167

才让卓玛

2017-2019

20

国家社科基金项目

20

基于数据驱动的藏语语音合成技术研究

22016077

才让卓玛

2017-2018

2

春晖计划

21

基于超图理论的超网络相继故障及应用研究

61603206

马秀娟

2016-2019

20

国家自然科学基金项目

22

藏语组块分析关键技术研究及组块库构建

61550004

李琳

2016-2018

15

国家自然科学基金项目

23

藏历算法模型及其自动推算系统研究

61550006

才藏太

2016-2018

25

国家自然科学基金项目

合计:860万元

4.项目结项

项目建设以来科研项目结项共10项,其中国家自然科学基金项目2项,国家社科基金项目1项,青海省科技厅项目1项。(见表2)

表2结项情况表(印证材料见附件2)

序号

课题名称

编号

负责人

结项时间

类别

备注

1

复杂网络抗毁性及其在三江源生态监测中的应用研究

2014-ZJ-721

肖玉芝

2017.12

青海省自然基金项目

主持

2

吐蕃时期古藏文词汇研究

13YJC740077

索南才让

2018.5

教育部人文科学研究项目

参与

3

面向自然语言处理的藏文句型自动分析及分布统计

13BYY141

才智杰

2018.3

国家社会科学基金

主持

4

基于树到串藏语句法翻译

若干关键技术研究

1363055

华却才让

2018.3

国家自然科学基金

主持

5

基于多策略融合技术的藏语动词短语自动识别研究

2015-ZJ-923Q

赵维纳

2018.5

青海省自然科学基金青年项目

主持

6

中国大百科全书-物理学(藏文版)

11365016

公报拉旦

2018.3

国家自然科学基金

主持

7

高原藏族人HIF1A基因多态性同地域性高血压的关系研究

2014—ZJ-724

宋长新

2017

青海省自然基金项目


8

复杂网络抗毁性及其应用研究

61440005

肖玉芝

2016

国家自然科学基金项目


9

藏语音素拼读法文语转换技术研究

61262051

才让卓玛

2017

国家社科基金项目


10

面向自然语言处理的藏语虚词研究

20161233

索南才让

2016

国家社科基金项目


合计

5.科技成果

序号

完成人姓名

成果名称

鉴定部门

鉴定日期

鉴定结论

鉴定号

1

肖玉芝

复杂网络抗毁性及其在三江源生态监测中的应用研究

青海省科技厅

2018.03

国内领先

26344981

2

宋长新

青海地区藏族人低氧适应HIF1A和VHL的单核苷酸多态性特征分析及数据库构建

青海省科技厅

2018.6

国际先进

26350317

3

宋长新

青海地区藏族人HIF1A基因多态性对若干基因调控的影响及其和高原高血压的关系研究

青海省科技厅

2018.6

国内先进

26350316

4

宋长新

高原藏族人HIF1A基因多态性同地域性高血压关系研究

青海省科技厅

2018.6

国内先进

26350275

6.论文

发表论文37篇,其中SCI/EI 20篇,中文核心期刊发表13篇(印证材料见附件4);

序号

作者姓名

论文名称

期刊名称

论文层次

发表日期

1

肖玉芝

基于多层复杂网络的微信用户行为分析

青海师范大学

一般

2017.12

2

索南才让

基于语料库的藏语语序结构研究

中国藏学

核心

2018.2

3

华却才让

基于混合策略的藏文人称代词指代消解研究

计算机工程与应用

核心

2018.5

4

华却才让

基于有限状态自动机阿拉伯数字与藏文数词自动翻译

计算机工程与科学

核心

2018.3

5

马秀娟

Cascading failures of k uniform hyper-network based on the

hyper adjacent matrix

PhysicaA

SCI

2018.7

6

才让加

基于Naive Bayes的藏文人名性别自动识别

青海师范大学学报

一般

2017.12

7

柔特

基于语序变换的藏文复述句生成方法

计 算 机 工 程

核心

2018.4

8

才让加

基于最大熵和HMM藏文新词识别对比研究

青海师范大学学报

一般

2018.3

9

才让加

文音节拼写检查的N CNN模型

中文信息学报

核心

已录用

10

才让加

注意力的端到端 模型生成藏文律诗

第十七届中国计算语言学学术会议

会议

已录用

11

周毛先

A Study on Machine Translation-oriented Parallel Corpus Construction Tech-

niques for Tibetan, Chinese and English

LAP LAMBERT Academic Publishing

会议

已录用

12

才藏太

面向语言信息处理的藏语短语及其分类方法研究

中文信息学报

核心

已录用

13

赵海兴

Syntactic word embedding based on

dependency syntax and polysemous analysis

Frontiers of Information Technology & Electronic of Engineering

SCI

2018.4

14

赵海兴

确定性均匀递归树的谱分析

电子设计工程

核心

2018.4

15

赵海兴

几类图的推广的拉普拉斯矩阵的特征多项式

应用数学进展

一般

2017.9

16

赵海兴

基于多视图集成的网络表示学习算法

计算机科学

核心

已录用

17

赵海兴

基于描述约束的词表示学习

中文信息学报

核心

已录用

18

赵海兴

Network Representation Learning based on Community and Text Features

第十七届中国计算语言学学术会议

会议

已录用

19

SCI

Syntactic word embedding based ondependency syntax and polysemous analysis

赵海兴

FITEE

2095-9184

20

SCI

Text-Associated Max-Margin DeepWalk

赵海兴

FITEE

2095-9184

21

SCI

Trees with large numbers of subtrees

肖玉芝

International Journal of Computer Mathematics

0020-7160

22

SCI

On the matching polynomial of hypergraphs

赵海兴

International Journal of Computer Mathematics

2020-7160

23

SCI

Processing of the Affixes in Tibetan Word Segmentation

华却才让

会议

24

SCI

A Tibetan input method for mobile intelligent devices

黄鹤鸣

会议

25

SCI

The Research on Cascading Failure

of Farey Network

Xiujuan Ma

会议

26

CSSCI

超网络的无标度特性研究

胡枫

中国科学

47, 060501 (2017 )

27

CSSCI

藏文复合句的依存句法分析

华却才让

中文信息学报

第30卷 第6期

28

CSSCI

基于语料库的藏语语音合成单元选择算法

才让卓玛

中文信息学报

第31卷 第5期

29

CSSCI

几类复杂网络的节点乘积度分布

马秀娟

青海师范大学学报

2017年第1期

30

CSSCI

几类图的推广的拉普拉斯矩阵的特征多项式

赵海兴

理论数学

31

基于词向量的藏语句子相似度计算

周毛先

会议

32

CSSCI

基于云平台的C语言课程的敏捷教学实践

宋长新

高教专区

47, 060501 (2017 )

33

CSSCI

基于超图的超网络相继故障分析

马秀娟

物理学报

2016(8)

34

CSSCI

基于多投影的脱机手写藏文字符特征提取方法

黄鹤鸣

计算机技术与发展

201602

35

CSSCI

基于锚点信息和句子长度相结合的汉藏句子对齐方法研究

才藏太

青海师范大学学报

201601

36

SCI

A small-world network derived from the deterministic uniform recursive tree by line graph operation

赵海兴

理论数学

201607

37

CSSCI

故藏文中的虚词研究

索南才让

西藏大学学报

201608

7.论著(包括著作、软著、国家标准)

序号

作者姓名

著作名称

出版单位

出版时间

著作类别

1

才让卓玛

藏文音素拼读法文语转换系统

中华人民共和国国家版权局

2018.5

软件著作权

2

才让卓玛

藏语常用语自动抽取系统

中华人民共和国国家版权局

2018.3

软件著作权

3

吉太加

藏语水平等级测试考试大纲(一级)

国家民族出版社

20017.12

著作

4

吉太加

藏语水平等级测试考试大纲(二级)

国家民族出版社

20017.12

著作

5

吉太加

藏语水平等级测试考试大纲(三级)

国家民族出版社

20017.12

著作

6

吉太加

藏语水平等级测试考试大纲(四级)

国家民族出版社

20017.12

著作

7

黄鹤鸣

信息技术 藏文字符排序规范

国家标准管理委员会

2018.6

国家标准

8

公报拉旦

大学物理学

中国藏学出版社

2017.12

著作

9

华却才让

藏文Wylie拉丁自动转写系统

中华人民共和国国家版权局

2017

软件著作权

10

华却才让

藏文半自动依存句法标注系统

中华人民共和国国家版权局

2017

软件著作权

11

才智杰

藏语句型结构分布统计系统

中华人民共和国国家版权局

2017

软件著作权

12

才智杰

藏语词位及分词标注转换系统

中华人民共和国国家版权局

2017

软件著作权

13

宋长新

构建基于WEB的高血压相关基因异常表达数据库及生物信息分析平台

中华人民共和国国家版权局

2017

软件著作权

14

宋长新

一种生物体内信息获取装置

中华人民共和国国家版权局

2017

发明专利

15

宋长新

一种带有短信功能的血压计

中华人民共和国国家版权局

2017

发明专利

16

宋长新

一种理疗信息采集装置

中华人民共和国国家版权局

2017

发明专利

17

宋长新

高原缺氧诱发高血压发生的分析方法

2017

发明专利

8.获奖成果

获奖者姓名

成果名称

奖项名称

发奖单位

奖励级别

获奖等级

肖玉芝

全国青年科普创新实验暨作品大赛

优秀指导教师

中国科协科普部

西年赛区

一等奖

马秀娟

Controllability of deterministic Networks withthe Identical Degree Sequence

青海省自然科学优秀学术论文

青海省人民政府

省级

二等

李发旭

On the Estrada index of cactus graphs

青海省自然科学优秀学术论文

青海省人民政府

省级

三等

吉太加

藏语句法研究

中国藏学研究珠峰奖

中央统战部

国家级

一等奖

宋长新

第九届全国蓝桥杯软件与信息技术程序设计大赛青海赛区

优秀指导教师

工业和信息化部

省级

二等奖

胡枫

第九届全国蓝桥杯软件与信息技术程序设计大赛全国总决赛

优秀指导教师

工业和信息化部

国家级

二等奖

胡枫

第九届全国蓝桥杯软件与信息技术程序设计大赛全国总决赛

优秀指导教师

工业和信息化部

国家级

三等奖

胡枫

第九届全国蓝桥杯软件与信息技术程序设计大赛全国总决赛

优秀指导教师

工业和信息化部

国家级

优秀奖

才让卓玛等

藏语语音合成系统的设计与实现

论文

青海省人民政府

省级

优秀

肖玉芝

New method for counting the number of spanning trees in a two-tree network

论文

青海省人民政府

省级

二等

宋长新

中国侨联新侨创新创业活动

优秀指导教师

青海省人民政府

部级

优秀

宋长新

C\C++程序设计

优秀指导教师

青海省人民政府

省级

优秀指导教师

胡枫

C\C++程序设计

优秀指导教师

青海省人民政府

省级

优秀指导教师

才让加、华果才让等

全国互联网+创新创业大赛总决赛

优秀指导教师

工业和信息化部

国家级

银奖

9.学术会议

组织者(参与者)姓名

会议名称

地点

时间

国际/国内

备注

马秀娟,尹君

2018年第十四届中国网络科学论坛

东南大学

2018年5月

国内

参加

索南才让

藏语语言学会议

上海师范大学

2018.7

国内

参加

赵海兴

图论,人工智能与复杂网络国际研讨会

青海师范大学

2018.7

国际

组织

柔特

第七届全国少数民族自然语言处理青年论坛

内蒙古师范大学

2018.7

国内

参加

10、主要研发人员及工作任务。例表如下:

排序

姓名

工作单位

联系电话

职称

工作任务

1

赵海兴

青海师范大学

13897463980

高级

项目负责

2

黄鹤鸣

青海师范大学

13709727656

高级

模式识别研究

3

才智杰

青海师范大学

18997073493

高级

藏语语言识别研究

4

华却才让

青海师范大学

18397101731

副高级

藏语语言识别研究

5

才藏太

青海师范大学

13997150332

副高级

藏语语音语料库建设

6

柔特

青海师范大学

13997097603

副高级

藏语语音语料库建设

7

索南才让

青海师范大学

13897441091

副高级

藏语语音语料库建设

8

头旦才让

青海师范大学

13997150332

中级

语音标注研究

9

周毛先

青海师范大学

18997073493

中级

语音标注研究

10

才让加

青海师范大学

13990427677

高级

项目负责与协调

11

韩维良

青海师范大学

13897463980

高级

模式识别

12

赵虎

青海师范大学

13709727656

副高级

复杂网络

13

李发旭

青海师范大学

18997073493

副高级

舆情分析

14

卢文

青海师范大学

18397101731

副高级

复杂网络

15

宋长新

青海师范大学

13897463980

高级

数据挖掘

16

才让卓玛

青海师范大学

13990427677

高级

语音识别

17

胡枫

青海师范大学

13897441091

高级

复杂网络

18

赵维纳

青海师范大学

13997150332

副高级

模式识别

19

肖玉芝

青海师范大学

13897463980

副高级

复杂网络

20

马秀娟

青海师范大学

13897441091

副高级

复杂网络

21

李琳

青海师范大学

13997150332

副高级

模式识别

22

尹君

青海师范大学

13990427677

副高级

模式识别

23

李峰

青海师范大学

13997097603

副高级

复杂网络

24

王小红

青海师范大学

13897441091

副高级

研究人员

25

孙茂松

清华大学

13997150332

高级

信息处理

26

邓波

青海师范大学

18997073493

副高级

藏语言

27

王新辉

青海师范大学

13897441091

副高级

藏语言

28

公保拉旦

青海师范大学

13997150332

高级

藏语言

29

吉太加

青海师范大学

13897463980

高级

藏语言

30

索南东主

青海师范大学

13990427677

高级

藏语言

11.人才培养情况。

培养了1名省级高校青年骨干教师,培养青海省“高端创新人才千人计划”人才6名,青海省“135高层次人才培养工程”4名,培养团队“青海师范大学藏文信息处理与机器翻译创新团队”,新遴选博士/硕士研究生导师5人,培养博士5人、硕士39人,招收博士研究生20人,硕士研究生50人。