关于本网站

本网站主要有三大板块,分别为学术文章、数据库和词典。

一、学术文章

  1. 文章主要为刁晏斌先生知网论文,按年份排列,点击标题即可进入查看具体文章内容。

/images/学术文章1.jpg

  1. 文章阅读界面有几大特点,一是右边附有各级标题来标示文章结构,方便读者时刻掌握自己阅览位置;二是文中脚注和尾注及参考文献统一用数字角标标注,鼠标放在上面即可查看脚注或尾注内容,点击可跳转到文章尾部具体标注处,如果一个注释后标有多个页码,则表明该文章/著作被多次引用;三是网页最后有该文章的PDF版本嵌入在网页中,如果文字版内容有错漏或不清晰的地方,可以以此为对照,也可以点击下载。

/images/学术文章2.jpg

  1. 文本内容是其PDF版由大语言模型文字识别后整理而成,如有错漏请以原始文件为准。

二、数据库

  1. 数据库主要由从几个华语新闻网站所采集的新闻构成,网站为马来西亚星洲网和新加坡联合早报网。对于前者,本网站收录了其2007年8月至2025年4月大约17.8亿字符的新闻内容,并从中每天随机抽取10条新闻(一天不够的10条的取最大值),标记为“星洲网(小,5000w)”,后者的则收录了2016年1月至2025年5月大约6.3亿字符的新闻内容,按照相同的抽选方式汇集为“联合早报(小,2848w)”。两个数据库仅作展示用,如有疑问请联系作者。

/images/数据库1.jpg

  1. 使用方法:首先选择一个数据库,然后输入想搜索的关键词,点击搜索前可以选择设置起始日期、结束日期和排序方式。搜索结果会显示该关键词有多少条结果(即出现在多少条新闻当中)和出现次数(即出现总频次),对于结果可以逐条点击“查看全文”来阅读包括标题、时间、链接等信息在内的该条新闻所有内容,关键词会高亮标出;也可以点击“统计结果”来查看该关键词在数据库中出现年份的频次统计,图表提供下载;还可以直接点击“下载结果”,将本次查询的所有内容输出为txt文件保存到本地中。

/images/数据库2.jpg

  1. 此外,还可以在选择数据库后,点击搜索框旁的“随机数据”,来阅读随机选取的10条新闻,这时只能查看新闻的全文,统计和下载功能不可用。

三、词典

本网页旨在方便科研人员对特定汉语词汇的释义进行检索和对比。此处整理的词典除了《全球华语大词典》外皆为网络资源,《全球华语大词典》是其PDF版由大语言模型文字识别后整理而成,没有经过审阅和纠错,如需引用,最好对原文进行查证。

/images/词典1.jpg