基于文本挖掘技术的中日提醒语句的对比研究

时间:2025-07-09

文本挖掘技术现在主要用于企业的市场调查以及网络上的自由发言的收集及分析。研究目的不同使用的文本挖掘方法也不同。本文引入文本挖掘技术这一研究方法,使用数据统计软件EXCEL2013对采集来的数据进行信息抽取及对应分析;并使用Trend Search 2008将其转换成简明的可视化信息数据图表,利用简洁明了的图表对中日大学生提醒语句中的措辞进行系统的多维度的分析。本文的研究目的有两个,一个为分析中日大学生在提醒长辈及晚辈时,

Education Research Frontier

December 2013, Volume 3, Issue 4, PP.194-199

Comparative Research on Chinese and Japanese Reminded Sentences Based on Text Mining

——Emphasis on the Politeness of Wording

Liying Mi

Department of Foreign Languages, Shanghai University of Finance and Economics, Shanghai, P.R.China

Email: mily6903216@http://www.77cn.com.cn

Abstract

Text mining technology is widely used in market researching, information collection and analysis with respect to the free speeches online. Concerning the fact that text mining technologies vary with the research goals, this paper analyzed systematically the polite words used by Chinese and Japanese students from multidimensional aspects by using data statistical software EXCEL 2013 to ex-tract information, and then Trend Search 2008 was applied to convert the information into a concise data chart; with the aim to dis-cuss the politeness of their words and expressions used by Chinese and Japanese students for reminding their seniors or juniors and to probe the relationship between politeness and region in using polite words and expressions.

Keywords: Text Mining; Reminded Sentences; Politeness; Data Chart

基于文本挖掘技术的中日提醒语句的对比研究*

——以措辞的礼貌程度为重点

米丽英

上海财经大学 外语系,上海 中国

摘 要:文本挖掘技术现在主要用于企业的市场调查以及网络上的自由发言的收集及分析。研究目的不同使用的文本挖掘方法也不同。本文引入文本挖掘技术这一研究方法,使用数据统计软件EXCEL2013对采集来的数据进行信息抽取及对应分析;并使用Trend Search 2008将其转换成简明的可视化信息数据图表,利用简洁明了的图表对中日大学生提醒语句中的措辞进行系统的多维度的分析。本文的研究目的有两个,一个为分析中日大学生在提醒长辈及晚辈时,所使用的语言是否存在礼貌程度的差异?另一个则为考察提醒语句中的礼貌程度是否存在地域差异?

关键词:文本挖掘;中日提醒语句;礼貌程度;数据图表可视化

引言

文本挖掘(Text Mining)是一个从非结构化文本信息中获取用户感兴趣或者有用的模式的过程。通过挖掘和分析,散布在海量文本当中的隐含知识就可能被拼凑起来,而形成一段完整的、可用的信息[1]。文本挖掘技术的特点是可以在短时间内完成海量数据的统计,得出各项数据之间的相互关系。由于电子形式的文本信息飞速增涨,文本挖掘已经成为信息领域的研究热点。本文从研究“礼貌程度”的角度出发,通过文本挖掘技术来分析中日文中提醒语句的表达特点,包括其提醒方式、语言的构成要素、语气的柔和及强硬等礼貌程度。 1 中日语言与“礼貌原则”的前期研究

仔细梳理前期研究,北京大学的顾曰国先生根据中国的历史文化背景和中国人日常交际的特点,提出*基金资助:受上海财经大学青年教师预研究项目-基本科研业务费(项目编号:2013110037)。

文本挖掘技术现在主要用于企业的市场调查以及网络上的自由发言的收集及分析。研究目的不同使用的文本挖掘方法也不同。本文引入文本挖掘技术这一研究方法,使用数据统计软件EXCEL2013对采集来的数据进行信息抽取及对应分析;并使用Trend Search 2008将其转换成简明的可视化信息数据图表,利用简洁明了的图表对中日大学生提醒语句中的措辞进行系统的多维度的分析。本文的研究目的有两个,一个为分析中日大学生在提醒长辈及晚辈时,

了汉语言文化交流中四个方面的礼貌特征:即尊重、谦逊、态度热情和文雅[2]。王建华先生认为语言礼貌在话语层面上是否礼貌,其决定因素是语用距离。语用距离就是指交际双方在特定的交际环境中所感知和确认的彼此之间的关系密切程度[3]。井出祥子指出Brown&Levinson的理论在日语普通话的适用范围上具有局限性。她同时指出欧美的各种理论都忽略敬语使用中的某些独特性,为了说明这一问题,她提出了一个“根据情况,选择用语”的原则[4]。泷浦真人解释研究工作者应该如何利用Brown&Levinson的礼貌理论去研究日语,同时指出礼貌原则和敬语、距离、终助词的意思之间的关系[5]。宫地映史从经济学的角度和风险的观点来探讨日语中的“待遇表现”。他将待遇表现分为“上下”、“内外”、“亲疏”关系,取其中的最大公约数订出“心理距离感”的标准[6]。福井启子以电视谈话节目中的谈话为材料,分析了人际交际中表现在语言行为上的中日“心理交际距离”的差异[7]。

前期研究对“礼貌原则”与“中日语言的特点”做了深入的分析,取得了优秀的成果,但是对于“提醒句”的研究甚少,且研究方法需要进一步的改进。因此,本文尝试使用文本挖掘技术抽出所需关键词和关键数据,对中日提醒句进行系统的多维度对比研究。

2 中日提醒语句 …… 此处隐藏:7025字,全部文档内容请下载后查看。喜欢就下载吧 ……

基于文本挖掘技术的中日提醒语句的对比研究.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219