
专题:中国经济远景纷乱、康庄大道——2025寰球两会财经相等报说念开云注册
2025年3月5日上昼,十四届寰球东说念主大三次会议在东说念主民大礼堂举行开幕会,国务院总理李强作政府责任讲解。
基于2025年《政府责任讲解》,澎湃新闻透过DeepSeek AI大模子,使用文本向量化的数据分析步调,深度剖析讲解中的策略密码。
澎湃新闻分析发现,凭证2025年《政府责任讲解》,本年的经济社会发展任务里,“发展”和“设立”是两偶然津词。
以“发展”为要津词,通过文本向量化分析,澎湃新闻找到了上百个干系度较高的词汇,如“经济”“改造”“产业”“民生”等。
不仅如斯,2025年《政府责任讲解》中,“设立”也在围绕着“当代化”“西席”“科技”等维度伸开。
聚聚首国政府网上的1978年-2024年的《政府责任讲解》,澎湃新闻进一步回来了这48年的《政府责任讲解》。
分析发现,48年间,“发展”“设立”以及“经济”等词汇,一直高频出现,是《政府责任讲解》中的“常青词汇”。
还有部分词语愈发时时地出当今《政府责任讲解》中,比如“改造”“民生”“服务”。因其增长趋势,澎湃新闻将此类词语称为“喇叭形词语”。
另外,在2025年《政府责任讲解》中,还出现了畴昔47年未尝说起的词语,举例“具身智能”“智能机器东说念主”“投资于东说念主”等。
分析步调:
1. 本文统共原始文本材料来自中国政府网1978年至2025年政府责任讲解。
2. 基于DeepSeek等AI大模子的文本向量化本领,对2025年责任瞻望的高频词进行干系分析,通过索求共现向量和语义不异度向量,量化计较高频词间的干系关系。
3. 本文使用jieba分词(https://github.com/fxsjy/jieba/)。聘请精确分词格局,幸免重叠分词和歧义。分词成果均去掉数字、单字、标点瑰丽。
4. 为增多分词正确率,在jieba分词的基础上加入自界说辞书,自界说辞书主要包含了往年东说念主民网和新华网统计的两会热词。
5. 在分词基础上,聘请TF-IDF加权本领。词语的蹙迫性跟着它在文本中出现的次数成正比增多,但同期会跟着它在语料库中出现的频率成反比着落。本文使用的语料库为1978年至2025年政府责任讲解文本。

海量资讯、精确解读,尽在新浪财经APP
包袱裁剪:刘万里 SF014开云注册