厉害了!竟然有程序员在GitHub上建了一个新华词典数据库
开源最前线(ID:OpenSourceTop) 猿妹 整编
整理自:https://github.com/pwxcoo/chinese-xinhua
今天,给大家推荐一个GitHub上的一个热门项目——chinese-xinhua ,一个新华字典数据库,截至今日,该项目已经获得了 8200+ 个「star」以及 1900+ 个「fork」。可能是知道的太少了
这个数据库收录了包括14032条歇后语,16142个汉字,31648个成语。(GitHub项目地址: https://github.com/pwxcoo/chinese-xinhua )
该数据库的所有数据都放在data/ 目录,对性能没需求的话,可以直接使用作者的新华字典 API 。下面,我们一起来详细了解一下这个数据库
项目结构
该数据库的项目结构如下:
chinese-xinhua/ | +- .vscode/ | | | +- launch.json <-- VSCode 配置文件 | +- data/ <-- 数据文件夹 | | | +- idiom.json <-- 成语 | | | +- word.json <-- 汉字 | | | +- xiehouyu.json <-- 歇后语 | | | +- ci.json <-- 词语 | | | +- ci.csv <-- 词语(csv 版本) | +- scripts/ <-- 脚本文件夹 | | | +- addAbbreviation.py <-- 给成语添加首字母缩写的脚本 | | | +- chengyu.py <-- 下载成语脚本 | | | +- word.py <-- 下载汉字脚本 | | | +- xiehouyu.py <-- 下载歇后语脚本 | | | +- ci.py <-- 下载词语脚本
数据库介绍
成语 [ { "derivation": "语出《法华经·法师功德品》下至阿鼻地狱。"", "example": "但也有少数意志薄弱的……逐步上当,终至堕入 。 《上饶集中营·炼狱杂记》", "explanation": "阿鼻梵语的译音,意译为无间",即痛苦无有间断之意。常用来比喻黑暗的社会和严酷的牢狱。又比喻无法摆脱的极其痛苦的境地。", "pinyin": "ā bí dì yù", "word": "阿鼻地狱", "abbreviation": "abdy" }, ... ]
词语 [ { "ci": "宸纶", "explanation": "1.帝王的诏书﹑制令。" }, ... ]
汉字 [ { "word": "嗄", "oldword": "嗄", "strokes": "13", "pinyin": "á", "radicals": "口", "explanation": "嗄〈叹〉 同啊"。表示省悟或惊奇 嗄!难道这里是没有地方官的么?--宋·佚名《新编五代史平话》 嗄á叹词。在句首,〈表〉疑问或反问 ,这是什么? ,你想干什么?"嗄"另见shà㈠。 嗄shà ⒈声音嘶哑 声。 嗄a 1.助词。表示强调﹑肯定或辩解。2.助词。方言。表示疑问或反诘。 嗄xià 1.见"嗄饭"。2.见"嗄程"。", "more": "嗄 ga、a 部首 口 部首笔画 03 总笔画 13 嗄2 shà 〈形〉 (1) 声音嘶哑的 [hoarse] 终日嚎而嗌不嗄。--《老子》 (2) 又如嗄哑,嗄嘶(嗓音嘶哑) 嗄 shà 〈叹〉 (1) 什么 [what]--表示否定 我要丢个干干净,看你嗄法把我治。--清·蒲松龄《聊斋俚曲集》 (2) 旧时仆役对主人、下级对上级的应诺声 [yes] 带进来"。两边军士应一声嗄",即将牛皋推至面前。--《说岳全传》 另见á 嗄1 á 〈叹〉 同啊"(á)。表示省悟或惊奇 [ah] 嗄!难道这里是没有地方官的么?--宋·佚名《新编五代史平话》 另见shà 嗄1 shà ㄕㄚ 嗓音嘶哑。 郑码janr,u55c4,gbke0c4 笔画数13,部首口,笔顺编号2511325111354 嗄2 á ㄚˊ 同啊2"。 郑码janr,u55c4,gbke0c4 笔画数13,部首口,笔顺编号2511325111354" }, ... ]
API接口
GET、POST均可,返回数据格式为JSON。下面将以GET做示例
直接请求 成语 ,则需要两个参数:
type=idiom 表示需要请求成语
word=兴高采烈 表示请求的成语
示例,如请求兴高采烈的成语,返回结果如下:
当你请求的是成语时,返回的结果包括:成语的来源、成语的解释、成语的拼音、用成语造的句子以及成语的首字母缩写。
直接请求 拼音首字母缩写 ,需要两个参数:
type=idiom 表示需要请求成语
word=xgcl 表示请求的成语拼音首字母缩写
请求 歇后语 ,同样需要两个参数
type=xiehouyu 表示需要请求歇后语
riddle=王婆 表示请求的歇后语的语面。可以模糊匹配
请求歇后语,结果会返回带有你输入的关键词的所有歇后语。
请求 汉字 ,需要两个参数
type=word 表示需要请求汉字
word=吴 表示请求的是
感兴趣的可以到GitHub上看看,果然是最怕程序员有文化。
广发银行济南分行315宣传活动暨征信业管理条例施行十周年主题宣传活动鲁网3月17日讯为引导社会公众进一步提高信用意识,熟悉了解常用的征信知识,树立正确的征信维权理念,自觉抵制非法征信修复行为,在征信业管理条例施行十周年之际,广发银行济南分行在中国人
科创板指数体系持续丰富近日,上海证券交易所和中证指数有限公司正式宣布新一批上证科创主题系列指数的发布安排,包括上证科创板新能源指数上证科创板工业机械指数上证科创板长三角指数及上证科创板粤港澳大湾区指数。
金价持续暴涨,同事妻子为何还要疯狂囤金同事妻子是一个全职妈妈金融专业本科毕业。对黄金有着特有的痴迷,尤其对金饰简直有点儿疯狂。第一次认识同事妻子还是2018年刚到江苏不久,由于我与同事是老乡的缘故,平时除了工作可以交流
冻鱼成本并不比活鱼低,半天妖被标准化害惨了NO。467作者观察君校稿程程编辑致知为了压缩成本,半天妖使用冻鱼替代活鱼?干餐饮的一看就知道,这似乎不太科学。近日,半天妖烤鱼被曝使用冻鱼和过期食材,甚至从垃圾桶回收食物,成为餐
哪一年提前还房贷最合算?前面提到普通人还是建议提前还房贷,那么哪一年还房贷最合算或者哪一年还房贷不再合算呢?我们来大致测算一下。以100万商贷,贷款30年,等额本息还款方式为例,通过房贷计算器计算如下可以
全球GDP四分天下欧洲占22。9,东亚占23。97,其他两家呢?2022年全球经济发生了比较大的变化,受到俄乌冲突和美国加息影响,全球各国的经济呈现两极分化,强者越强,弱者越弱。一些陷入停滞的国家,已经逐渐无法维持住自己的经济体量了。根据中美欧
睡八个小时就表明睡得好吗?事实并非如此对于成年人而言,每天睡眠8小时是一个标准的时间,但是,睡8个小时不一定代表睡得好。实际上,很多人睡了8个小时,仍然感到疲惫不堪,甚至还会出现头痛肌肉酸痛等身体不适的情况。那么,为什
药食同源养生茶中药茶代加工厂家唐朝时期的黄帝内经太素一书中写道空腹食之为食物,患者食之为药物,即反映了药食同源的思想。本文将向您介绍药食同源养生茶中药茶代加工厂家。药食同源中药茶代加工厂家代加工厂怎么找?1药食
中天科技再次终止拆分中天科技海缆上市事宜收监管工作函每经记者程雅每经编辑张海妮3月19日晚,中天科技(SH600522,股价16。80元,市值573。38亿元)发布公告称,董事会同意终止所属子公司中天科技海缆股份有限公司(以下简称中
马切吉亚尼不记得大罗之后,还有谁像奥斯梅恩这样有决定性直播吧3月20日讯本轮结束的意甲联赛,那不勒斯40客胜都灵,奥斯梅恩梅开二度。比赛结束后马切吉亚尼在意大利天空体育演播室对奥斯梅恩的表现发表了他的看法。马切吉亚尼表示我认为奥斯梅恩
沉寂四年后,中国新拳王诞生上周四,哈尔斯WBA职业拳王争霸赛在浙江永康打响,在头条主赛中,中国选手吕斌仅用时99秒就击败了泰国选手甘萨,赢得WBA超蝇量级国际金腰带,也为中国拳击带来了疫情后的第一道曙光。文