2024经济与金融数据课堂 开讲了~~
事实数据之于经管、社会科学学者,就像科学实验之于理工科研究者,是进行学术研究的事实数据基础。数据课堂旨在提升大家的数据获取和使用能力,使大家不仅知道从哪里获取数据,如何获取数据,同时学会判断所获取数据的质量,挖掘深藏在数据背后的逻辑,全方位提高数据素养。欢迎老师、同学们积极参与数据课堂培训,并为办好数据课堂出谋划策……
第一讲 中文“智能”文本分析系统——文数平台的使用
【主 讲 人】 陈宇龙、龙毅
【讲座时间】 2024年3月15日(星期五)下午2:30-3:30
【讲座方式】 腾讯会议:160-782-081
会议网址:https://meeting.tencent.com/dm/rtpGnmXZLPuG
【讲座内容】 :
1、 通过文数·财经文本分析平台的使用介绍,为大家呈现平台强大的检索能力;
2、 根据自定义关键词逻辑组合与黑名单排除等高级检索功能,完成更复杂的原文匹配检索需求,精准定位所需文本;
3、 使用丰富的文本分析工具集,处理自有的文本数据,完成文本数据的定制。
【数据库介绍】
《文数·财经文本检索分析平台》(以下简称“文数平台”)是数行者科技有限公司(Datago)研发的一款中文财经垂直文本检索与数据分析平台,平台覆盖关于中国资本市场特别是A股市场的海量文本数据,包括新闻、社交媒体、公告与年报、分析师研报、网上问答路演等。文数平台的检索引擎支持复杂的关键词匹配逻辑,辅以时间范围、信息源、上市公司相关性等属性筛选,可帮助用户精准搜索所需的文本,并支持一键批量导出相关命中文本的情感评分和可读性等分析结果。
文数平台数据库数据目录:
数据目录
文本检索
清华大学访问使用权限
年报
年报章节文本分析数据库
全部数据的访问、检索、下载权限
新闻
网络新闻量化舆情数据库
报刊新闻量化舆情数据库
新闻联播文本分析数据库
3年检索和下载权限
社交媒体
股吧个人投资者舆情数据库
雪球个人投资者舆情数据库
投资者关系
互动问答文本分析数据库
网上路演文本分析数据库
投资者关系记录文本分析数据库
政府报告
政府工作报告文本分析数据库
专题数据
特色数据
报刊新闻ESG量化舆情数据库
暂未开通使用
高级数据
上市公司数字化转型明细数据库
可用
上市公司报刊媒体关注及舆情数据库
上市公司网络媒体关注及舆情数据库
数字化转型媒体关注明细数据(新闻联播)
政府工作报告数字化转型明细数据库
基础数据
上市公司数字化转型数据库
上市公司报刊媒体关注数据库
上市公司网络媒体关注数据库
数字化转型媒体关注数据(新闻联播)
政府工作报告数字化转型数据库
文本分析工具集
词向量查询
基于Datago拥有的海量财经文本数据,以新闻文本为语料进行词向量训练。根据不同的语料,分别提供基于报刊新闻、网络新闻和所有新闻的词向量数据查询。
相似词查询
基于Datago语料词向量的相似词查询功能,与词向量的语料分类一致,也提供基于报刊新闻、网络新闻和所有新闻的相似词查询,并提供扩展功能,能够帮助用户更好的准备检索词表。
关键词表定制
为用户提供批量关键词的定制与管理服务。用户可通过多种方式进行关键词表的扩充,一键导入批量下载列表,无需重复输入。
情感分析
情感分析是自然语言处理 (NLP) 的一个分支,使用机器学习来分析和分类文本数据的情感基调,包括积极、消极和中立的情感分类。共有5款分析模型。
可读性分析
可读性分析是可读性研究的核心:通过分析指定文本,提供该文本的难度值或判断该文本适合哪一水平的读者,从而获得该文本的可读性指标。共有2款分析模型。
【数据库说明页】
https://ecollection.lib.tsinghua.edu.cn/databasenav/entrance/detail?mmsid=991022536799903966
【主讲人简介】
陈宇龙:数行者(深圳)科技有限公司 技术总监,哈工大计算机硕士,10年+软件开发经验。
龙毅:数行者(深圳)科技有限公司 CEO,港大计算机博士,港中文Fintech博士后,13年+数据挖掘经验。
在线咨询馆员
咨询电话:62782137
服务时间:
周一至周日 8:00-22:00
请发送邮件至
答案通过E-mail发送给您
当面咨询 服务时间:周一至周日 8:00-22:00
服务地点:北馆一层总服务台
联系电话:010-62788937
联络您的学科馆员,为您提供针对学科的深度咨询服务
清华图书馆