论文评审意见应该怎样写(论文评审意见怎么写 模板)
一、问题的提出
质量标准与社会需求紧密相关,研究生教育质量是社会各界对高校培养研究生“量”的要求及“质”的要求。有数据显示2016年,我国在校研究生总规模达1981051人,博士研究生在校生数达342027人,硕士研究生在校生数达1639024人[1]。在庞大的数量基础上,协调数量与质量的矛盾,确保研究生教育质量稳步提升,已成为新时代研究生教育的主要问题。撰写学位论文可检验研究生对专业领域理论知识及实践技能的掌握程度,综合反映研究生独立从事科研工作的能力。袁本涛等人认为,研究生教育质量包括狭义与广义两个方面,狭义的研究生教育质量就是指研究生的学位论文质量[2]。常思亮和何维雄将研究生学位论文优良率作为反映研究生教育质量效率的重要指标[3]。为保障研究生学位论文质量,2014年政府管理部门制定了《学位授予单位研究生教育质量保证体系建设基本规范》,其中明确规定要健全研究生学位论文质量过程管理机制。国内关于研究生教育质量研究较多,但对研究生学位论文质量研究尤其是定量研究的很少。因此开展研究生学位论文质量定量研究,对学位论文过程管理具有重要的理论价值和现实意义。
文献计量领域专家安东尼·拉昌指出,同行评价是评价文献质量的主要途径[4]。梁帅等人认为,基于同行评议的专家评审意见是学术论文最原始、最直接、最全面的质量认定[5]。李敏等人认为,专家评阅意见能直观且详细地反映专家对所评论文学术水平的综合判断,具有丰富的信息量和重要的参考价值[6]。盲审专家是研究生学位论文质量的“把关者”,评审意见也是最能反映论文质量的材料。研究生学位论文管理相关条例明确规定了学位论文同行评审须采用盲审手段,即不透露研究生个人信息及导师相关信息,因此良好地保证了评审过程的公正性。评阅意见具有很强的问题导向性,能够聚焦到研究生学位论文的各种细节问题上,反映评阅专家最关注的问题、研究生学位论文的主要特点、提高研究生学位论文质量的方向等三个信息。故笔者从“差评”研究生学位论文盲审评阅意见出发,深层次分析专家评语,鉴别与分析“差评”研究生学位论文主要问题,为学位论文过程管理中鉴别“差评”论文提供参考,进而提升研究生学位论文质量。
二、研究设计
(一)研究对象
“差评”论文是指同行专家盲审意见总体评价等级为“C”及“D”的论文。研究选取S大学2017年所有“差评”研究生学位论文作为研究对象,共有411份“差评”论文的评阅意见(共计11万余字),涉及哲学、经济学、法学、教育学、文学、理学、工学、农学、医学、管理学、艺术学等11个学科、99个专业。S大学为我国中部地区“211工程”及“双一流”学科建设高校,研究生学位论文送审专家均为校外“211”“985”高校本学科领域的专家。本研究得到S大学研究生院的支持,原始论文评阅意见书均从该校研究生信息管理系统获得,故研究资料具有代表性和权威性。
(二)研究方法
1.词频分析方法
字词是文本最基本的意义单元,统计文本中用词的频次,可以反映与文本主题相关方面的趋势和特点[7]。研究采用词频分析方法,借助Python语言的jieba模块,选择精确模式进行词汇切分[8]。提取评阅专家在评阅意见中提及频次最高词汇,以反映评阅专家最关注的问题。Python语言需要一定的计算机语言基础,但较传统分词工具有快速、精准及可定制化特点。具体操作如下:
一是对文本资料进行预处理,保存为Python可读取的编码形式为UTF-8的TXT文档。二是借助jieba模块进行精确分词,并去除与论文质量不存在直接关联的词汇以及停用词、英文、数字、特殊符号等,并将表达意思相近的词汇合并。三是将所得结果写入Excel中,并利用Excel绘制图表。词频分析可反映专家评阅研究生学位论文时最为关注的问题,初步展现“差评”学位论文的整体特点,给予研究者宏观方向的引导。
2.文献编码方法
仅仅采用词频统计方法分析,结果太过粗略,既无法深入挖掘研究生学位论文存在的微观问题,也难以反映各种问题之间的逻辑关联,故还需借助文献编码方法,细化词频分析结果。研究借助澳大利亚QSR公司设计开发的质性研究软件Nvivo10.0进行编码分析,鉴别“差评”研究生学位论文的主要特点。研究步骤如下:一是将硕士学位论文评阅意见按所属学科分别归类命名,分为11份文档。由于博士学位论文评阅意见样本量较少,故单独为1份文档,共计12份文档,即12个材料来源。将论文评阅意见转化为Nvivo10.0可读取的Word文档形式,并将文档导入到软件中。二是对评阅意见逐句逐段浏览编码,倘若一段话中包含多个概念,则分别标记到相应的节点,在编码过程中不断调整节点关系最终确定研究框架。三是利用Nvivo10.0绘制相应图形,将图形及编码统计结果导入Excel中。
节点确定的依据有两个方面:一是词频分析结果。词频分析结果反映了评阅专家在撰写评语中提及次数最多的词汇,可以推断出研究生学位论文存在的主要问题集中在这些方面。二是S大学研究生学位论文评价指标体系。该指标体系是相关专家经过多次修改而成,博士研究生和硕士研究生学位论文评价指标大致相同,具有科学性及可行性。
三、结果与分析
(一)结果统计
1.数据基本情况统计
对411份“差评”论文分布情况进行描述性分析,结果分布在表1中。具体包括硕士研究生374份,其中361份总体评价等级为C,13份总体评价等级为D;博士研究生37份,其中29份总体评价等级为C,8份总体评价等级为D。各学科“差评”学位论文的数量从高到低依次是教育学131份、艺术学77份、法学62份、文学42份、理学37份、管理学27份、工学16份、哲学11份、医学4份、经济学3份、农学1份。S大学共送审2017届研究生论文2721份,总“差评”率为15.10%。各学科送审数量具体包括哲学42份、经济学69份、法学363份、教育学709份、文学333份、理学482份、工学51份、农学4份、医学171份、管理学195份、艺术学302份。论文“差评”率从高到低依次是工学(31.37%)、哲学(26.19%)、艺术学(25.50%)、农学(25.00%)、教育学(18.48%)、法学(17.08%)、管理学(13.85%)、文学(12.61%)、理学(7.68%)、经济学(4.35%)、医学(2.34%),见表1。
表1 S大学各学科“差评”研究生学位论文数量统计
2.词频结果统计
借鉴孙清兰提出的高频词与低频词临界值计算公式[9]。通过jieba模块分词处理,共出现2610个词汇,槡2610=51.09,故得出高频词与低频词临界值为51,即频次大于51的词汇为高频词。将表达意思相同的词汇合并,得出18个高频词(具体见图1)。从高到低依次是写作规范520次、研究方法449次、语言表达401次、论文题目383、论证375次、参考文献330次、逻辑277次、对策与建议266次、理论基础206次、结论139次、研究意义131次、摘要128次、研究设计105次、文献综述101次、概念94次、创新性93次、结果93次、观点68次。其结果表明,评阅专家对研究生学位论文的写作规范、研究方法、参考文献、逻辑与结构、结论与建议、创新性等问题关注较多。
图1 S 大学研究生“差评”学位论文评阅意见词频统计
3.编码结果统计
在反复研读论文评阅书的基础上,结合词频分析结果及S大学研究生学位论文评价指标体系,经过多次讨论和修改形成编码的一级节点和二级节点,三级节点直接引用评阅意见中的文字,将表达意思相近的语句进行整合,形成11个一级节点、23个二级节点和118个三级节点(由于篇幅原因不在文中一一列举)。11个一级节点具体是论文题目不当、文献综述失范、逻辑结构混乱、研究设计随意、论证分析薄弱、核心概念模糊、结论与建议不实、写作态度不端正、写作不规范、内容缺乏新意、缺乏创新成果(见表2)。
表2 S大学“差评”研究生学位论文评阅意见编码情况统计
编码结果细化了词频统计结果,使“差评”研究生学位论文特征更加清晰。评阅意见共编码1417次。其中:第一,“写作不规范”的编码次数最高,共编码473次,其下属二级节点“格式排版不规范”共编码267次,在所有二级节点中编码次数最高,占18.84%;第二,“逻辑结构混乱”编码288次,其二级节点“层次逻辑凌乱”编码次数为229次,在所有二级节点中编码次数排第2位,占16.16%;第三,“研究设计随意”编码178次,其二级节点“研究方法失当”编码141次,在所有二级节点中编码次数排第3位,占9.95%;第四,“写作态度不端正”编码次数较少,共编码23次,其中包括“工作量不足”编码15次,占1.06%,“学术不端”8次,占0.56%;第五,“缺乏创新成果”编码9次,占比最少。
(二)特点分析
1.研究主题不明确
确定研究主题是学位论文撰写的“第一步”,研究主题的确定需经历从发现问题到确定研究对象边界,再从确定研究对象边界到主题解释与意义反思,这是一个不断调整的过程。确定研究主题不仅需要考虑其可研究性,还需考虑其理论意义与现实价值,并综合自身研究能力调整选题的宽度与难度。“差评”论文研究主题不明确主要表现在以下四个方面:
第一,研究假设缺乏或不合理。“研究假设随意”在二级节点中编码10次,表明部分论文随意提出带有强烈主观色彩的研究假设,依据不充分,缺乏相关文献线索。有些“差评”论文甚至没有研究假设,不知所论为何,缺乏问题意识。第二,研究对象不清晰。它在二级节点中编码27次,主要包括论文中的研究对象不清晰不突出,研究对象不符合题目的范围。例如,评阅专家在评阅某篇管理学论文中提出:“社会工作职业社会认同度到底是指谁对社会工作职业的认同度?该文并没有明确也没有区分认同的对象,但这个问题在这项研究中很重要。”第三,论文题目不当。“论文题目”在词频统计中出现383次,排在高频词的第4位。在文献编码中“论文题目不当”共编码72次,其中“论文选题不当”编码14次,“章节标题不当”编码58次。论文选题不当主要表现在:一是选题太宽泛,指向性差,文章浮于表面缺乏理论深度;二是选题陈旧,重复研究现象严重,缺乏新的理论意义和实践意义;三是论文选题与作者所学专业不符,作者对论文选题的学科专业界限缺乏了解。例如,某篇行政管理专业论文的专家评阅书指出:“XX市两型社会发展的问题与对策似乎属于行政管理专业之外的选题,故本选题需要做较大调整与修改。建议作者以行政管理专业领域研究的问题作为论文选题的出发点与最终归宿,以行政管理专业的学术话语体系及理论基础作为论文依据”;另外,论文题目的问题还包括“章节标题不当”,表现在章节标题不明确、模糊,没有凝练和概括文章的内容及作者的观点,甚至出现论文总题目与章、节标题相同以及章与节的标题相同的现象。例如,某篇法学专业的论文专家评阅意见指出:“我国检察机关行政公益诉权的现状及问题标题不够明确,我国检察机关行政公益诉权有什么问题,理论问题还是制度问题?保护问题还是实施问题?下面内容也不够明确。”第四,核心概念模糊。核心概念是论文的“导向标”,界定核心概念的过程即明确研究主题方向的过程。在词频统计中,“概念”出现94次,排在高频词的第14位。在文献编码中,“核心概念模糊”共编码67次,其中“概念界定模糊”编码41次,“偷换概念”编码26次。“差评”论文中核心概念问题表现在:一是没有界定核心概念或者界定不清。有的作者做论文时根本无核心概念的意识,缺乏对核心概念的把握在研究中重要性的认识。例如,专家评阅对某篇体育人文社会学专业论文的意见:“作者对于核心概念界定过于含糊,这是由于作者本身对于‘正义'的概念认知不明确。”二是概念偷换,或者随意扩大或压缩核心概念的内涵与外延。例如,《XXX视觉符号在淄博日用瓷中的设计研究》一文的评阅意见指出:“文中所提的研究对象是淄博的陶瓷行业,而非淄博日用瓷的设计。”再如,《XXX羽毛球私教的优化发展研究》一文将“XXX羽毛球私教的优化发展等同于长沙市羽毛球私教的发展现状”。
2.逻辑结构混乱
清晰的逻辑结构是学位论文最基本的要求,而逻辑结构(包括顺序逻辑和层次逻辑)混乱是“差评”论文最主要的特点之一[10]。“逻辑”在词频统计中出现277次,排在高频词的第7位。在文献编码中“逻辑结构混乱”共编码288次,其中“顺序逻辑杂乱”编码59次,“层次逻辑凌乱”编码229次。值得注意的是“层次逻辑凌乱”编码次数,在所有二级节点中排第2位。第一,“差评”论文的“顺序逻辑杂乱”,表现在文章结构顺序安排没有严格按照研究设计进行,部分重要章节缺失或为了拼凑字数画蛇添足导致结构冗余。例如,专家评阅某学科教学(思政)硕士学位论文时指出:“第一章的第三节是初中思想品德个性化课堂教学的组织原则,出场太早,在论文开始就找到解决问题的基本原则了,不合逻辑。”第二,“差评”论文的“层次逻辑凌乱”,表现在文章观点前后矛盾,前后章节彼此割裂,文章的内容和文章标题处于相互独立状态即“两张皮”现象。例如,评阅专家指出某出版专业硕士学位论文的逻辑问题:“在第三章第一节与下面的第一个问题有逻辑上的矛盾。第一节一脉相承的编辑思想与办刊理念。另起炉灶,坚持经典,一脉相承与另起炉灶是相反的两回事。”
3.论证分析方法不当
论证分析即检验研究假设或观点是否合理的过程,观点论证需要恰当的理论基础、合适的研究方法、足够材料的支撑及严谨的论述分析。“论证”在词频统计中出现了375次,排在高频词的第5位。“差评”论文论证分析存在的主要问题包括:第一,论证方法失当。方法是研究过程中的“利刃”,它既是逻辑推理的需要,也是结果论证的需要[11]。“研究方法”在词频统计中出现了449次,排在高频词的第2位,“研究方法失当”共编码141次。“差评”论文方法失当的问题具体包括:一是在文章引言中随意罗列多个研究方法,但文中并未实际使用;二是不清楚具体研究方法的性质和使用范围,也不顾论文主题和内容的性质,随意选用研究方法。例如,某篇差评论文的评阅意见是“采用文献研究法,本论文不是做文本解读,不可能实际也没有用此方法”;三是论证方法使用不当,表现在诸多方面,如测量指标不合适、模型构建不合理、问卷设计粗糙、信效度问题等,方法使用错误则会导致文章结论的可信度降低,例如,评阅意见中有“实验方法存在明显问题,这些问题让人质疑该文中采用方法的可靠性”;四是论证方法单薄,突出表现为论证方法单一、验证过程缺乏科学性、方法典型性及综合性不够等。第二,论证材料贫乏。“论证材料贫乏”共编码35次,具体表现为论文论证材料太少、缺乏一手数据或者论证材料陈旧、庞杂适切性不强等。第三,论述分析浅显。“论述分析浅显”编码102次,表现为论文的理论分析不深入、未结合相关材料分析、论述偏离了文章论点以及论述缺乏归纳总结等问题。例如,专家在评阅某哲学专业论文时指出:“文章找不到几处像样的哲学论证,更多看到的是资料的堆砌。”第四,文献综述失范。“文献综述”在词频统计中出现101次,排在高频词的第14位。“综述缺乏条理性”编码50次,“文献评述不够”编码22次。文献综述失范具体表现在四个方面:一是有的论文中没有文献综述内容;二是国外研究现状综述内容过于简单,应付了事,不能反映现有研究状况;三是文献综述偏离主题,与论文主题不符,或者把对实践发展现象的综述作为对现有研究文献的综述;四是有的论文单纯追求文献资料的堆砌,综述研究内容“多而杂乱”“多而宽泛”,没有针对性;五是有的文献综述“述多评少”,甚至“只述不评”。例如,专家评阅某人类学专业文章时指出:“该文章文献综述部分不够扎实,没有很好地总结和梳理,对文献的评述部分更是薄弱,导致文章的结构较为松散。”
4.结论不实与建议泛化
研究不仅需要发现问题,分析原因,还需要针对问题提出实际指导性的、落地的建议。差评论文的“对策与建议”在高频词中排名第8位,共出现了266次,“结论”在词频统计中出现139次,排在高频词的第10位。在编码分析中“结论建议不实”共编码60次,包括二级节点“研究结论不实”38次,“对策建议泛化”22次。“差评”论文的对策建议内容存在的主要问题有以下两个方面:第一,论文的研究结论凭空想象,缺乏足够证据,或结论与文章主题毫无联系,部分论文中摘要所提结论与文中结尾部分的结论完全不一致。第二,大部分差评论文的对策建议没有与所论问题及原因形成相应的逻辑匹配,或者所提对策建议泛化,可操作性不强,没有实际价值。例如,专家评阅某体育教育训练学专业文章时指出:“研究目的是为了借鉴国外顶级球员战术特点,启发和促进我国女子优秀球员的水平提升,而作者对建议部分着力不够,没有提出相应的能够解决问题有价值的建议。”
5.写作不规范
所有“差评”学位论文都出现了严重的写作不规范问题。“写作规范”在词频统计中出现520次,排在高频词的第1位,是专家提及次数最多的词汇。“写作不规范”共编码473次,是评审专家所提意见最多的问题。这些问题主要表现在四个方面:第一,语言表达不规范,编码84次,“语言表达”被评阅专家提及401次,排在高频词的第3位。表现为文中错别字太多、语言重复啰唆、语句不通说法不严谨、部分计算机专业论文中出现大段代码等。第二,目录、摘要及关键词等格式不规范。目录不规范表现为部分论文目录与著作目录混用或与文章标题不一致;摘要不规范表现为摘要未凝练出文章观点、与研究结论重复、英文摘要与中文摘要不对应等;关键词不规范表现为关键词缺失、关键词过长、关键词提取不准确等。第三,参考文献和引文标注不规范。“引文标注不规范”编码122次,“参考文献”在词频统计中出现330次,排在高频词的第6位。有的作者未能区分注释和参考文献,分不清夹注和脚注,有的文中对引用文献内容引文不做或者只做少量注释。所有“差评”论文的参考文献的引文注释格式都不规范。第四,论文排版不规范,表现为图表编排不规范、表格未严格按照规定格式进行编排、页面排版不美观、页码混乱或缺少页码、字体错误、段落缩进错误等。例如,某评阅专家指出:“建议作者在Word中用全选模式,选取全文文字,然后选择字体格式,把英文字体统一改成Times NewRoman体,目前论文的下载版本的英文是宋体格式。”
6.写作态度不端正
写作态度涵盖两个方面:一是科研工作量不足;二是学术不端。“工作量不足”编码15次,“学术不端”编码8次。论文“工作量不足”主要表现为文章内容单薄、前期准备不足及文章硬伤太多等方面。部分学生急于升学就业导致论文研究时间较短,文章中出现多处知识硬伤,甚至有评阅专家指出:“建议作者按照学校要求重新学习专业课程。”论文“学术不端”既是不尊重他人的研究成果,也是对自身不负责任的表现,具体表现为随意伪造资料、篡改数据、抄袭同级别论文、抄袭网络原话等。例如,评阅专家提到该文“抄袭嫌疑:论文的访谈设计的文字内容以及课堂观察的文字几乎完全照抄了XXX的硕士论文第20页的内容,却没有提及该文献来源。对测试的描述在文字上仍然有XXX的影子”。又如,某位评阅专家提到:“对于XXX的相关研究具有抄袭XXX大学硕士生论文《XXX参与程度的影响研究》的重大嫌疑。”
7.创新性缺乏
当下是“大众创业、万众创新”的时代,研究生学位论文创新受到了社会各界的关注。“创新”在高频词中排在第17位,共出现93次;“创新性问题”共编码47次,其中,“内容缺乏创新”38次,“缺乏创新成果”9次。论文创新性缺乏:一是内容缺乏新意,包括观点缺乏新意、研究方法缺乏新意。表现为一味依赖他人的研究思路、模仿他人的研究方法、对研究主题未形成个人独特的见解等。例如,专家评阅教育学文章提到:“文章创新不够表现在完全借鉴他人思路和方法,仅是利用现有的模型和工具对数据进行分析和解释。”二是缺乏创新成果。表现为工学及艺术学研究生毕业设计作品缺乏新意、实用价值或艺术价值较低、博士研究生未发表与学位论文相关的研究成果。例如,专家评阅室内设计相关文章提到:“对于XX网络咖啡厅设计的研究与提炼很不够,并且设计的新意不足。”
四、结语
借助Python语言及质性研究工具Nvivo10.0分析所得结果,揭露了“差评”研究生学位论文主要特征。直接指向“差评”论文具体内容的缺陷,包括论文主题、逻辑结构、论证分析、结论与建议、写作态度、写作规范、创新性等方面,这些特征之间是紧密联系并且相互重叠的。通过分析“差评”学位论文的主要特征,指出其不足,为学位论文过程管理中鉴别“差评”学位论文提供了参考,依据研究生实际情况“对症下药”,对于提升研究生学位质量具有重要意义。与此同时,研究内容也为研究生学位论文质量评审提供了思路和方法的指引。传统的研究生学位论文评价体系存在诸多的漏洞,如专家遴选时对如何对专家数量、专家研究方向、专家对评审论文的熟悉程度、专家主观看法等方面做出判断。以专家评审意见为基础的评审,专家不仅需要评审论文,还需对本人做出的评审意见进行评审,这可以在一定程度上避开相关主观因素的影响[12]。正如范海思提出的威斯康星精神强调了高等教育的社会服务职能,认为高等教育的教学与科研活动都应考虑其实际社会功用。潘懋元先生也提出,在高等教育大众化阶段,高等教育利益相关者增多,高等教育的目的不应只是高深的理论,还要求理论应与实际结合,为社会发展所用[13]。研究生学位论文作为评判研究生教育培养质量的重要指标,不应只强调其高深的理论价值,学位论文的实用性也应得到关注。因此,可进一步将七个方面特征归结为对研究生学位论文学科性、规范性、学理性、实用性、创新性的要求。学科性是对论文具体选题、框架逻辑和研究方法的要求;规范性是学位论文质量的基础;学理性是对研究生学位论文理论价值的要求;实用性是学位论文的最终归宿;创新性是对论文思路和方法的卓越追求。
在要求研究生学位论文学科性和规范性达标基础上,追求学理性、实用性和创新性需要研究生和管理者协同努力。研究生应尽早明确研究方向,端正研究态度,夯实专业基础。既要考虑论文的学理性,也要关注实用性,做到理论与实践相结合,以理论指导实践。关注实用性并不意味着一味的重复研究,创新性应是研究生学位论文的卓越追求。管理者在实际管理过程中,需要不断审视自身,顺应时代发展潮流。坚持“以学生为中心”的管理理念,加强国际合作拓展优质的科研资源,倡导科研与教学融合,优化课程体系和教学内容,为研究生科研提供物质基础[14]。与此同时,发挥论文质量监督者的作用,在优化学位论文评价体系的同时,对违反学术道德的行为进行严厉处罚,营造良好的学术氛围。