拓尔思信息技术股份有限公司
- 企业全称: 拓尔思信息技术股份有限公司
- 企业简称: 拓尔思
- 企业英文名: TRS Information Technology Co., Ltd.
- 实际控制人: 李渝勤
- 上市代码: 300229.SZ
- 注册资本: 87362.0932 万元
- 上市日期: 2011-06-15
- 大股东: 信科互动科技发展有限公司
- 持股比例: 25.3%
- 董秘: 李党生
- 董秘电话: 010-64848899
- 所属行业: 软件和信息技术服务业
- 会计师事务所: 立信会计师事务所(特殊普通合伙)
- 注册会计师: 安行、李强
- 律师事务所: 北京市天元律师事务所
- 注册地址: 北京市海淀区建枫路(南延)6号院3号楼1至7层101
- 概念板块: 软件开发 北京板块 创业板综 专精特新 深股通 融资融券 预亏预减 深成500 DeepSeek概念 AI智能体 Sora概念 多模态AI 数据要素 ChatGPT概念 AIGC概念 Web3.0 信创 电子身份证 东数西算 数字经济 虚拟数字人 数据安全 元宇宙概念 数据中心 华为概念 知识产权 乡村振兴 人工智能 国家安防 网络安全 2025规划 互联金融 大数据 云计算 军工
企业介绍
- 注册地: 北京
- 成立日期: 1993-02-18
- 组织形式: 大型民企
- 统一社会信用代码: 911100006000107204
- 法定代表人: 李渝勤
- 董事长: 施水才
- 电话: 010-64848899-6618,010-64848899
- 传真: 010-64879084
- 企业官网: www.trs.com.cn
- 企业邮箱: ir@trs.com.cn
- 办公地址: 北京市海淀区建枫路(南延)6号院金隅西三旗科技园3号楼
- 邮编: 100096
- 主营业务: 人工智能产品及服务、大数据产品及服务和数据安全产品及服务等
- 经营范围: 一般项目:软件开发;技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;以自有资金从事投资活动;计算机系统服务;数据处理服务;计算机及办公设备维修;计算机软硬件及辅助设备批发;计算机软硬件及辅助设备零售;电子产品销售;通讯设备销售。(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)(不得从事国家和本市产业政策禁止和限制类项目的经营活动。)
- 企业简介: 拓尔思信息技术股份有限公司(简称“拓尔思”)成立于1993年,是中文全文检索技术的始创者,领先的人工智能、大数据和数据安全产品及服务提供商。公司2011年在深圳证券交易所创业板上市,股票代码300229。公司在全国设有4大区域中心31家分公司。自成立以来,拓尔思始终坚持核心技术自主研发,拥有40+发明专利、1000+软件著作权,一直引领全文检索和搜索引擎数据库、自然语言处理(NLP)技术的原始创新和应用场景落地,成功服务了一批国家级重要信息化项目的建设,成为国家企业信用信息公示系统、信用中国、国家知识产权检索系统、GA云搜索等国家级基础设施的数据管理和检索引擎。公司产品曾获得国家科技进步二等奖、上海市科技进步一等奖、中国电子学会一等奖、北京市科技进步二等奖、王选新闻科技特等奖等多项重要荣誉。拓尔思坚持“数智+赛道”的发展战略,以优秀的科技能力打造丰富的行业解决方案,为企业、政府实现数字化升级赋能。公司自主研发的TRS大数据平台、TRS人工智能平台和安全一体化平台,已成为行业领先的数字化基座。同时,公司已建立了大规模的数据和知识资产,正在全面构建云和数据服务生态(SaaS&DaaS)。目前,公司的数智产品与服务已被国内外10000余家企业级用户广泛使用,尤其在企业数字化转型、数字政府、网络内容安全、融媒体、金融科技和开源情报等领域实现了深度应用。基于公司三十年的NLP技术积累和三大数据资产平台积累的高质量数据,公司在2023年全面发力大模型的研发和行业落地,自主研发拓天大模型,并在媒体、金融和政府等垂直行业落地。
- 商业规划: 报告期内,公司立足"数字中国"建设浪潮,依托在数字政府、融媒体、金融科技、数字企业及公共安全等领域的战略卡位优势,构建了以拓天大模型一体化平台+拓天链智能体平台为核心的智能底座,以领域大模型+领域专家架构为协同进化范式。同时,公司持续拓展数据采集的深度与广度,强化数据治理的精细化水平,深度融合行业知识图谱与海量高质量数据资产,在多个垂直领域率先落地大模型与智能体应用。此外,公司大力推动出海战略,研发了两款出海产品,持续深化垂直领域AI创新场景应用的拓展。(一)拓天大模型2024年,AI赛道持续升温,市场竞争加剧,技术与产品加速迭代。大模型发展迈入新阶段,从比拼参数迈向深耕应用,更加重视实际成效,力求深度融入大众生活与工作,提升用户满意度与体验,切实发挥助力作用。1、拓天大模型及智能体应用实践成果报告期内,拓天大模型一体化平台凭借应用易维护、能力易连接、业务易协同、数据易运营以及模型易优化的特点,精准锚定用户需求,助力其在垂直领域与特定场景量身定制大模型智能应用,深度赋能产业升级。2024年4月,公司率先接入DeepSeek作为拓天大模型的基础模型,拓天大模型具备强大的任务适应性,运用少样本乃至零样本技术路径,高效产出优质回答与内容,搭配智能体(AIAgent)模式驱动机制,实现了从“被动回应”的传统语言模型向“主动出击”执行工作任务的智能体的跨越转变,极大拓展了模型的实用效能。2024年,拓天大模型及智能体在千行百业的落地进程中成绩喜人,已成功应用于9大垂直领域40多个项目,应用场景持续拓展,呈现出蓬勃兴旺的发展态势,为众多行业注入全新活力,切实推动各领域数字化、智能化转型迈向新高度。智能问答:为解决传统政务咨询机器人答非所问、匹配准确率较低、无法满足真实诉求等问题,拓天·政务大模型以“大模型引擎”为主体、以“向量索引引擎”为辅助、以“智能搜索引擎”为补充的三大引擎协同机制,通过聊天对话的方式,全面优化提升智能问答服务水平,可精准理解用户复杂的、口语化的提问,支持多轮会话,且整个回答过程有清晰思考链路,为用户提供全天候自动化、精准化、场景化、主动化、实时化的智能互动服务。目前,该应用已经在自然资源部、贵州、广西、深圳等政府成功落地,实现了对用户咨询问题的“秒回”“准回”“智回”,不仅显著提高了公众满意度,也有效树立了政府高效服务的良好形象。政策解读:利用拓天·政务大模型深入分析政策文件,通过构建知识图谱将条款与案例库相连接,实现精确政策解读与智能咨询服务,支持自然语言交互查询专业名词解释、政策要点、政策解读等,为用户提供“一站式”权威解答。在用于办公场景时,还提供深入剖析政策走向及其对行业的影响,提供指标提取、变迁分析以及对比分析等服务,为政府的政策制定部门制定新策提供科学依据。目前,该应用已经在自然资源部、贵州、广西、深圳等政府单位以及国网能源研究院、数所大学院校等机构成功落地。智能办公:基于生成式大模型自动构建公文框架,可自动生成符合政府机关行文规范的公文内容,并准确引用相关政策表述、法律法规等,结合语法/语义检测模型,避免格式错误及表述偏差,提升智能公文的文本规范性撰写与错误纠正,解放公文撰写过程中的模板化重复工作。目前,该应用已在海关成功落地,示范效应显著。基于拓天·舆情大模型的舆情分析助手,用户只需输入简单的自然语言提出需求,该助手便能快速响应,自动理解用户意图、自动创建监测方案、自动进行关键数据分析、自动调用相关思维链,高效完成用户所需要的舆情监测、数据统计与分析、撰写舆情分析报告等工作,大大节省了各项操作的时间和精力。舆情报告助手则主要用于舆情领域常见的撰写事件分析报告场景,用户用一句话简单描述需求后,系统便会自动解析用户的需求,自动匹配相关信息,通过DeepSeekR1长思维链和拓天大模型融合,进行推理分析后,自动创建事件关键词方案、梳理事件进程,并进行传播数据、媒体报道情况、KOL观点、网民观点等维度的分析,只需几分钟即可生成报告,实现过去数小时才能完成的工作。目前,该模型已在公司网察大数据服务平台成功运行一年多,服务了数百个订阅用户。同时,该应用已在国家发改委、新华网以及多个省级网信办等权威单位成功落地。拓天·开源情报大模型将“信息提取、归纳总结、逻辑推理、内容生成、智能问答”等基础能力赋能开源情报全业务流程,为各级业务部门提供智能化的态势感知、威胁发现以及目标建档能力,同时提供大模型问答的模式开展开源情报业务工作,全面提升用户工作效能。在开源情报数据处理中,拓天·开源情报大模型通过主题提取和文档聚类功能,快速识别关键主题并归类相似内容,帮助情报分析师高效提取核心信息,大幅提升处理效率;基于命名实体识别与消歧技术精准区分各类实体,避免名称歧义导致的误判;通过关系挖掘功能则从文本中提取语义关系,构建知识图谱,清晰呈现潜在联系。用户输入简洁指令(如“查询量子计算领域近半年的开源情报及进展”),模型可快速统计相关信息总量、占比及变化趋势,并精准反馈检索结果,让海量情报条理清晰。在监测方案创建中,用户只需输入需求(如“新型航天材料研发情报的关键词方案”),模型即可生成贴合需求的关键词组合,简化流程,节省时间。报告生成方面,无论是专项报告还是例行报告,模型均可快速整合核心情报,生成内容详实、数据精准且可视化良好的报告。拓天·开源情报大模型显著提升了开源情报分析效率,帮助情报分析师从繁重的文档阅读工作中解放出来,实现快速处理海量数据,及时洞察风险与机遇。通过深度挖掘信息背后的联系,为决策提供更全面、深入的支持,增强了情报分析的深度。同时,情报分析师结合自身专业能力对模型输出进行验证,有效保障了情报分析的质量,推动情报分析业务不断发展,更好地适应复杂多变的情报需求。目前,该应用已在多个防务部门及国防大学、国防科技大学等机构中成功落地。AIGC智能编辑助手:在媒体资源检索与策划方面,该智能助手可为编辑记者提供媒体资源检索、选题策划、智能撰稿和摘要以及高效精准的内容合规审查服务。其多模搜索功能涵盖智能文本搜索、图片搜索、视频搜索、多语言搜索、语义搜索等场景,有效提升了编辑记者的信息搜集效率。此外,智能审核与校对功能通过多维度精准识别文字、视频、音频、图片等内容,能够有效检测其中的错误或违规内容,从而提升内容质量和传播安全性。该智能助手一方面可助力媒体机构降本增效,减少人力投入的同时大幅提升内容产出效率与质量;另一方面,可推动媒体内容生态的优化升级,以智能化手段强化主流媒体舆论引导力,进一步巩固媒体公信力,为行业发展注入强劲动力。目前,该创新应用已在人民日报、中国日报、中国环境报、中国青年报等多家权威单位成功落地。智能审校:可对各类文字材料中的字词错误、知识错误、常识错误、政治错误、敏感词等进行实时审校,全面提高文字质量。目前,该应用已经在人民日报社、中国环境报社、人民出版社、解放军出版社、国家大剧院等权威机构成功落地。拓天·公安大模型通过在公安内网部署,接入公安大数据服务平台,实现了对警情研判、指挥调度、公文写作、数据分析、情报挖掘、侦查打击、风险防控、执法办案、智能安保、应急处置等公安业务场景深度赋能。例如:运用拓天大模型DeepSeek版强大的数据分析、逻辑推理能力,强化数据分析赋能警情研判,对警情进行多维度、精细化地研判,快速、自动地生成警情分析报告。强化预测预警赋能风险防控,通过实时调取情指中心提供的线索、事件信息数据库,深度挖掘历史数据和实时信息,模型能够预测可能出现的风险事件,并提前发出预警信号。强化数据碰撞提升安保精度,通过接入多样感知源数据,形成了精确、实时的热点区域和潜在风险点分布情况并形成实时预警机制,实时推送到情指行三屏。强化推演分析赋能应急处置,通过智能分析与预测,警方能够精准识别潜在风险点,优化警力资源配置,缩短应急响应时间,提升整体处置效率。强化规范审查赋能执法办案,辅助法制工作人员对执法办案材料进行规范性审查,显著提高文书审查效率和公安执法规范化水平。目前,该应用已经在多个地市公安局成功落地,助推警务工作提质增效显著。信贷风控:公司通过拓天·金融大模型显著提升了银行风控数据加工生产的精准度与效率。同时,与RAG融合,不仅强化了金融风控知识的整合与实时数据的更新能力,还有效突破了传统大模型在金融风控领域的知识局限性,从而极大提升了生成内容的质量。这一系列优化措施,直接促使风控预警信号的准确率实现了大幅提升。目前,该应用已在平安银行、渤海银行、农业银行等信贷风控项目中成功落地,在贷后风险管理、投后风险管理、供应商监控、宏观研究、合规内控等多个关键场景,为银行提供了专业、高效且全面的金融风控预警支持。内容审查:在银行营销内容审查应用场景中,在实现路径上,银行首先依托拓天·金融大模型搭建起营销素材库、合规知识库以及风险案例库,将过往积累的海量营销资料、金融法规条款、因违规受罚的典型案例录入其中,为精准审查筑牢数据根基。在实际审查环节,大模型充分施展其智能分析专长。一方面,针对新产品推广文案、各类营销活动宣传资料,从保护消费者权益、遵循金融监管规定等多维度构建审查指标体系,对文本进行深度剖析。例如,能快速识别出夸大收益、隐瞒风险、不当诱导等违规表述,精准揪出潜在风险点。另一方面,利用自然语言处理技术与深度学习算法,对营销话术的情感倾向、逻辑连贯性进行评估,确保信息传达准确清晰,避免消费者误解。举例而言,当一款理财产品即将推向市场,其宣传文案提交审查时,拓天·金融大模型迅速扫描文本,不仅标记出“年化收益高达20%,稳赚不赔”这类夸大收益误导消费者的语句,还能依据法规库给出修改建议,帮助营销团队优化文案。目前,该应用已在兴业银行、中国银联、百年人寿等内容审查项目中成功实践,助力银行营销合规高效开展,切实维护金融市场秩序与消费者权益。智能消费者保护:在银行智能消费者保护场景下,拓天·金融大模型在实施落地时,依循风险归因→靶向整改→机制沉淀→投诉压降的科学路径,助力消费者投诉处理模式从“被动扑救”向“主动防控”转变。拓天大模型深度赋能投诉处理各关键环节:投诉受理时,借助语音识别精准录入投诉内容,依托自然语言处理构建智能分类模型,快速匹配对应标签,实现高效分流;投诉处理阶段,自动生成解决方案与贴心回复话术,同时推荐相似案例以供参考;定责结案环节,凭借对海量相似历史投诉案例的深度学习,给出客观定责建议;归因分析环节尤为关键,它将繁杂的投诉内容转化为结构化、标准化数据,支持交互分析并智能生成优化策略,深挖投诉根源,精准定位问题症结,比如精准识别是产品设计缺陷、服务流程漏洞,还是沟通话术不当引发投诉。目前,该创新应用已在招商银行、民生银行、浙商银行、国投信托、浦发银行等多家金融机构的消保项目中成功落地。产业投研和对公营销:在银行产业投研场景中,一方面,在整合海量宏观经济数据、产业动态资讯以及企业财报信息基础上,拓天·金融大模型可助力银行深度洞察行业趋势,通过智能分析精准勾勒各产业发展脉络,为投资决策提供前瞻性依据。例如在新兴科技产业投研上,能提前预判潜在增长点与风险点,使银行投资团队精准布局,提升投资准确率。另一方面,在风险评估环节,大模型凭借强大的数据分析能力,对拟投资企业进行全方位“体检”,涵盖财务状况、市场竞争力、信用评级等多维度,有效识别潜在风险企业。于对公营销场景而言,在客户画像方面,在整合企业工商、税务、交易流水等多元数据基础上,拓天·金融大模型可快速勾勒出精准且立体的客户形象,帮助营销人员深入了解客户需求,提升营销精准度。目前,该应用已在公司产业大脑平台成功运行一年多,服务了数百个订阅用户。同时,该应用也在中国银行浙江分行成功落地,大幅提升了银行对公业务的市场竞争力。拓天·智库大模型开启了新一代智库研究的智能化模式。课题筹备阶段,一方面提供海量知识、前沿热点追踪、思路启发与文献综述,帮助专家精准把握研究动态;另一方面,专业知识图谱关联多领域知识,提升知识整合效率。智能推荐与个性化服务依科研成果、兴趣构建用户画像,推送个性化检索、文献与社交推荐,帮助专家挖掘前沿课题、提效并拓展合作。专业知识发现板块,模型依靠数据挖掘与分析,结构化解析专业元素、汇聚高质量证据,为科研赋能。在政策研究方面,深入剖析政策走向及其对行业的影响,涵盖政策资讯解读、指标提取、变迁分析以及对比分析等内容,为研究团队制定策略提供坚实依据。文稿辅助写作环节,智能推荐关键词、句式与图表数据,提升文稿编写效率与专业性。成果摘要提炼能快速抓取核心观点,加速传播。自动翻译助力国际交流,文字校对确保文稿规范。目前,该创新应用已在中国医学科学院医学信息研究所、国网能源研究院、南京图书馆以及数所大学院校等单位成功落地,提升决策效率,助力智库在竞争中突围,实现可持续发展。拓天·专利大模型聚焦于专利领域,基于大模型、智能体插件、技能服务、调度服务、AI公共服务等能力,为实用新型明显创造性审查及通知书撰写、局部外观设计检索、专利语义检索、自动生成技术综述、案源聚类等核心应用场景提供专利知识问答、专利多模态语义搜索、专利文件自动生成、外观专利图片识别及图生文、专利深度挖掘等功能。目前,该应用已在国家知识产权局得到成功落地,助力国家持续提高知识产权的审查质量和审查效率,加快推进人工智能大模型在审查工作中的应用。2、拓天大模型一体化平台为持续强化智能底座的竞争力,2024年4月,公司率先接入了DeepSeek作为拓天大模型的基础模型,同时围绕“精度、速度、效能”三大维度完成了拓天大模型一体化平台里程碑式的升级,提升以下6大竞争优势。首先,公司基于全生命周期的数据治理体系,持续优化与沉淀了海量高质量训练数据,重点围绕预训练数据、强化训练数据、SFT训练数据的优化开展模型精度提升训练,其次,公司聚焦技术创新,着力探索大模型优化路径,综合运用量化压缩、结构剪枝、知识蒸馏三大技术手段,深度融合架构优化策略与软硬协同机制,针对不同参数规模的大模型开展精准微调工作。在此过程中,技术团队依据模型特性与应用需求,精细调配各项技术占比,确保微调效果达到最佳。经多轮严格测试与优化后的模型,在开源中文榜单以及专业能力评测等权威评估体系中展现出卓越性能,相较于开源的官方基座模型,其评测成绩实现显著提升,在语义理解、文本生成等关键维度均具备更强的竞争力。公司从多方面技术路径提升大模型推理速度:模型层面,通过量化压缩将高精度的浮点数参数转换为低精度格式,在几乎不损失模型精度的情况下,大幅减少内存占用和计算量,加快推理速度。通过结构剪枝去除模型中对推理结果影响较小的连接和神经元,简化模型结构,降低计算复杂度。硬件层面,借助GPU、TPU等专用硬件快速处理大量数据以及深度学习效率,显著提升推理效能。同时,优化硬件与软件的协同,使模型代码能高效地在硬件上运行。算法层面,采用知识蒸馏,让小模型学习大模型的知识,小模型推理速度快,且精度损失不大。还可通过优化推理算法,如采用更高效的矩阵运算方法,减少不必要的计算步骤,进一步提高推理速度。通过这些技术路径的综合运用,能有效提升大模型的推理速度。在研发过程中,研发团队选取了性能优秀的Qwen2.5作为基础模型,通过精心设计的微调训练方案对其进行深度优化。在一系列严格且专业的评测环节中,将拓天14B模型与Qwen2.5的官方原生模型展开横向对比分析。评测范畴涵盖自然语言处理的多个关键领域,包括但不限于文本生成的流畅性与逻辑性、知识问答的准确性、语义理解的精准度等。结果显示,经过精细微调后的拓天14B模型在各项专业评测指标上均表现优异,相较于开源的Qwen2.5大模型展现出了多方面的优势,无论是应对复杂的任务理解还是垂直业务领域的知识理解与推理,拓天14B模型以更小的模型更快的速度达到大模型的精度。公司运用基于Merge的减小微调灾难遗忘方案,开启高效微调模式。该方案具有显著优势,在微调过程中,多个子业务数据能够独立开展训练,无需引入其他开源数据或历史微调数据。这一特性极大地精简了训练数据量,使得训练时间大幅缩减,显著提升了训练效率。更为关键的是,即便业务数据微调出现轻度过拟合的情况,也无需担忧会对其他任务的表现产生破坏。此方案能让模型在多任务处理中保持较高精度,为行业数据的精准微调提供了坚实保障。通过这种方式,公司能够更加游刃有余地微调行业数据,最终更为快速、有效地解决大模型灾难性遗忘问题,为业务的高效开展和模型的稳定应用奠定了良好基础。公司在开源模型Qwen2.5BaseModel基础上进行微调。该基础模型在TRS业务上表现不足,其他通用能力表现不错。单纯TRS业务微调后的模型在除业务能力外的综合能力上有所下降(出现灾难性遗忘)。通过采用基于Merge高效微调方案合并得到最终的模型,在所有任务上均有最好的表现。公司通过采用对齐用户偏好、RAG的深度优化、Token级溯源、通过FunctionCalling拉通业务系统、ToSQL打通业务数据等技术手段实现各领域大模型专业能力的精进。拓天大模型已全面完成与华为、寒武纪、摩尔线程、沐曦、天数、海光等主流国产GPU的深度适配。在与华为的合作中,基于华为昇腾910B3,拓天大模型团队依托华为MindIE源码,通过精细的研发投入,针对性地增加数据指令和能力指令适配。该成果已在多个公共安全类项目中成功落地,有效提升了当地公共安全领域的智能化水平,助力安防工作提质增效。在中国环境报项目中,拓天大模型完成了在寒武纪MLU370与天数平台上部署运行,完成了训练与推理全方位的适配验证工作,确保模型从基础构建到实际应用的连贯性与稳定性,为后续业务拓展及复杂场景应用筑牢根基。拓天大模型在摩尔线程上的适配已通过中国信通院的测试。携手沐曦C500,拓天大模型聚焦在线政务智能问答服务,精准对接贵州、广西、深圳等地区政府部门需求,为政务服务数字化转型赋能。目前,该服务已稳定运行,切实帮助各地政府提升服务效率,优化群众办事体验。基于海光K100,拓天大模型顺利完成最新14B、72B模型的适配与验证,具备成熟的落地生产条件,可随时响应市场需求,投入商业化运营,进一步拓展公司业务边界。凭借在国产GPU适配领域的成果,拓天大模型在纯国产化架构下能够高效稳定运行,切实为信创体系强化智能支撑,助力公司在信创产业赛道稳健前行。公司融合开源和行业数据构建高质量训练数据,从多个方面对大模型进行了基础能力的整体优化与提升:面向大模型的文档语义解析:版面分析在PDF文档的解析中至关重要,因为大多数的论文为两栏结构,而且存在图片和表格等多种混合的情况。版面识别出图片和表格后,需要调用多模态能力来进一步识别与处理。对此,拓天大模型的研发团队基于SOTA模型进行了针对性训练和调优,覆盖范围支持WORD、PDF常规文档、论文、报表、报告等,细粒度类别涵盖9类,包括页眉、页脚、标题、段落、表格、图片、图表等。OCR优化:研发团队主要针对医保单据图片、公安问询笔录及案件卷宗等场景进行OCR识别优化,通过统一视觉API接口,多线程并发执行OCR内容识别、OCR标题识别、CVR识别、二维码识别、分辨率识别、角度识别功能,同时,通过合成场景数据集,以及蒸馏技术训练优化OCR模型,提高识别准确率,同时减少模型参数,提升推理速度,实现了特定场景下文本图片扫描识别能力的提速、提质。并且通过优化推理服务框架,提升并发性,提升CPU和GPU的利用率,端到端的并发推理速度提升明显,在大数据场景,极大降低了硬件资源的消耗,更加容易落地。视频人像识别优化:针对关键帧选择,进行了算法迭代,可动态选择清晰图像,避免了模糊图像识别准确率低的问题;在模型选择方面,使用人像识别SOTA模型结构arcFace,人像准确率达到99.8%(LFW数据集);调整人像库图片,优化远景、低头、侧头误差高的问题。重排模型优化:重排是RAG场景里面重要的信息过滤技术,排除掉不相关的上下文信息。研发团队在bge-reranker-base的基础上,重新设计了损失函数,进行模型效果的优化。在自建的业务数据集上进行微调并测试,准确率指标得到明显提升。3、拓天链智能体平台报告期内,公司推出拓天链智能体平台。该平台深度融合知识库、工具组件与大型语言模型(LLM)优势,依托前沿的智能体(AIAgent)技术,聚焦简化问答系统构建流程以及攻克复杂问题处理难题。尤为突出的是,该平台专为非技术背景人员打造无代码或低代码操作环境,极大程度降低人工智能项目落地门槛,令AI项目实施更为便捷。凭借直观交互界面,用户仅需通过便捷的拖拽与配置操作,即可迅速搭建起工作流,彻底摆脱对底层技术细节的深度钻研,真正实现高效、敏捷地运用人工智能技术赋能业务发展。拓天链智能体平台主要由四部分组成:Agent=智能Agent大脑+规划技能+记忆+工具使用。智能Agent大脑:主要由拓天大模型负责,包含Agent记忆体和多策略融合的任务规划与分解。Agent记忆体主要分为短期记忆和长期记忆,短期记忆主要由拓天大模型的历史记录,长期记忆存储在海贝向量数据库中。任务规划与分解:主要由微调后的拓天大模型负责自动规划。感知:感知模块的核心目的是将Agent的感知空间从纯文字领域扩展到包括文字、听觉和视觉模式在内的多模态领域。本平台标准支持文本输入、视觉输入、听觉输入,通过扩展还可以感知更复杂的端侧输入。Agent工具组件:主要包括大模型的组件、输入输出组件、外部工具接口以及存储检索相关工具等。提示工程:提供内置拓天大模型的Prompt提示,用户也可以自定义。可视化工具链配置:平台提供了一个直观的拖拽界面,用户可以通过简单的拖拽和配置操作来构建工作流,无需深入了解编程或复杂的开发过程。Agent中心:企业可以通过拓天链构建业务创新所需的专属Agent中心,平台支持多Agent模式,用户可以创建多个针对不同任务的单个Agent,并进行集中管理,包括创建、修改、发布、共享等操作。前端问答展示和API调用:对每个任务链可以单独提供问答页面展示,用户可以自定义页面功能。同时,任务链也提供API接口调用,方便用户集成。为进一步提高智能体项目的准确性,公司研发团队基于拓天链智能体平台进行了以下关键技术的优化改进:检索增强技术改进意图理解与解析:时间解析、地点解析、人物解析等,优化检索条件多轮对话信息补全:根据上下文判断问句是否存在缺失项,补全问句长文档内容压缩:根据场景提取摘要,压缩长文档内容向量GraphRAG:增加知识图谱抽取,建立实体关联;检索中增加图谱检索图表生成技术改进转换成Mermaid代码,然后再进行图表生成。能够实现思维导图、流程图、饼状图、折线图、甘特图、类图等多种形式的图表。自动规划技术改进自主规划:先将与用户问题最相关的工具进行前置检索和召回,然后模型对用户输入的当前问题、上下文和模型能使用的工具进行分析,模型判断出解决当前问题需要使用哪些工具,从而规划出可由现有工具完成的计划链路,或不使用工具。工具验证:判断模型规划出的工具链路是否正确,检测需要调用的工具所需参数是否已经提供,如果未提供,需要向用户“反问”获取信息;如果用户提供了完整的参数信息,或者当反问客户之后拿到了缺失的参数信息,就完成了执行计划链路的准备。工具调用:系统根据模型的规划来进行行动,来执行各个工具。行动可以是调用外部工具、查询数据库或者直接生成答案。答案生成:模型根据输入的问题和工具调用的返回结果进行分析,给出对问题的回答。多模态技术改进通过多模态大模型以及文档解析等技术,实现复杂文献的版面理解能力,图像、表格、公式、正文的问答。报告期内,拓天链智能体平台已成功应用于中国日报、浦发银行、国家电网能源研究院、北京科委某大模型课题、南京图书馆以及多个防务类项目共10多个应用场景。该平台帮助用户减少了软件开发成本,提高了软件开发与运营效率,为企业和其开发者提供了强大的AI项目开发支持。(二)数据服务报告期内,公司为解决各数据产品部门多源异构数据采集分散、治理割裂、标准缺失、应用滞后四大痛点,研发了拓思数据平台。该平台定位为拓尔思集团的企业级数据资产智能中枢,构建“采-存-治-用”全链路赋能体系,通过基础治理、智能增强、应用赋能三级架构支撑前台业务场景数星、网察、数家等数据服务产品实时数据调用,实现场景化服务支撑,推动数据要素向业务价值的深度转化,进一步释放数据资产潜能。2、数据资源基础信息数据来源公司的原始数据来源广泛且合规,主要来源于公开的互联网平台,包括但不限于数字报刊、新闻网站、政府及权威机构官网、移动客户端、社交媒体、第三方平台、短视频平台、元搜索、维基百科等。公司通过自主研发的海蜘智能化采集平台,对上述互联网公开信息进行合规采集,确保数据的来源清晰、可追溯。数据类型公司采集数据的类型包括网页文本、图片、音视频、附件以及卫星遥感等其他特种数据采集。数据规模截至2024年12月31日,公司累计采集的数据总量超5,000亿条。公司每日新增数据采集量平均约为5亿条以上,每年新增文本与图片超1,500亿条,短视频约400亿个,每年经处理后的文字与索引存储300TB以上。数据规模持续稳定增长,为业务发展提供了坚实的数据基础。数据权属公司高度重视数据权属问题,严格遵守相关法律法规和平台规定。公司采集的数据均为公开信息,且在采集过程中充分尊重数据所有者的权益,确保数据的使用符合法律法规和道德规范。公司对采集的数据拥有合法的使用权,所有采集的公开数据都经过公司自研的人工智能技术平台进行自动分类、自动查重、实体抽取、多维度知识标注、质量校核等加工处理,实现了互联网非结构化数据到结构化数据的智能转化。在物理上按照一定逻辑归集后达到一定的数据规模,形成可重用、可应用、可获取的数据集合,从而达到数据资源化的效果,并在业务范围内合理使用数据资源,不涉及任何侵犯第三方权益的行为。数据质量公司在数据质量管理方面遵循DCMM数据管理能力成熟度稳健级(3级)认证标准,从多维度进行数据质量的保障。准确性公司采集的互联网资讯数据均来源于官方媒体及政府机构在各个平台上发布的真实可靠的信息。这些权威机构均实行严格的“三审三校”信息发布制度,确保信源内容的准确性和可信度。所有原始采集信源均经过人工核查、梳理和标注,以保证信源的真实性。原始数据采集后,其清洗策略通过人工配置的解析脚本和多维度知识库(包括垃圾信息、广告信息及有害信息等知识库)进行标准化处理,确保数据的精准解析和清晰呈现。这一过程严格遵循原始信源的格式,避免在采集和加工过程中改变数据的原始信息量和完整性。完整性为确保数据采集的全面性,公司采用人工配置的解析模板,针对每个信源进行标准化处理,完整捕捉原始信源发布的每条数据,并确保核心字段的完整性。例如,新闻类数据的关键字段(标题、正文、时间、来源)均纳入采集范围,避免信息碎片化。数据采集结合自动化流程与人工校验,解析模板提取结构化核心字段,智能算法预处理非结构化数据,确保数据可用性。同时,公司建立数据质量监测体系,实时监控核心字段完整性。若发现数据缺失(如缺少发布时间),系统自动预警并触发人工校验,通过上下文关联或信源追溯补充缺失信息。通过“模板化采集+智能监测+人工校验”的多重保障机制,公司有效避免信息遗漏,确保数据在采集、传输、存储和加工环节的完整性。一致性为确保数据一致性,公司在不同平台间数据传递时,遵循统一数据与服务标准,对同一类型数据进行归一化处理,包括去重和合并。公司制定统一数据格式规范,涵盖数据类型、编码规则等关键要素,确保数据交互时的一致性。系统自动清洗数据,去除重复信息并整合分散片段。例如,多平台发布的新闻资讯通过唯一标识符去重,补充信息合并到主记录。公司开发标准化API,采用统一传输协议和封装格式,避免平台差异导致的数据偏差。同时建立实时验证机制,定期对比源数据与目标数据,自动校正偏差。对于复杂或敏感数据,系统标记高优先级,交由人工审核团队二次验证,修正问题并优化流程。通过这些机制,公司确保数据在不同平台间的一致性,提升数据可信度,增强跨平台协作效率,为数据分析和业务决策提供可靠基础。时效性为确保数据的时效性和准确性,公司根据数据的使用场景及重要性,对不同类型、不同信源的数据按照不同频率进行周期性更新。实时性要求较高的数据(如实时新闻资讯、热点新闻)采用高频次更新,通常为分钟级或秒级,依赖实时数据流和自动化采集技术,确保用户获取最新信息。其他数据依场景需求设置不同频率,如5分钟、10分钟、30分钟或60分钟更新。周期性更新的数据(如市场调研报告、行业统计数据)根据使用频率和业务需求,设置每日、每周或每月的更新周期,适用于变化较慢但需定期更新的数据类型。这种灵活的更新策略合理分配资源,确保数据时效性,降低更新成本,为业务决策提供可靠支持。权威性为确保数据的权威性和可信度,公司严格筛选数据来源,确保其可靠性和公信力。数据主要来源于官方媒体、各级政府机构以及权威行业组织。这些来源具有高度的公信力和专业性,能够提供准确、真实的数据支持。例如,宏观经济数据来源于国家统计局、财政部等官方机构;行业数据则来自权威行业协会或专业研究机构等。这些机构在数据发布前均经过严格的审核流程,确保数据的准确性和合规性。此外,公司还与众多权威新闻媒体保持长期合作关系,如新华社、人民日报等。通过严格的数据来源筛选和权威机构合作,公司确保所采集的数据具有高度的可信度和公信力。这些数据不仅为业务决策提供了坚实的基础,也在经济分析、社会研究等领域展现出重要的应用价值。可访问性为确保数据的可访问性,公司依据不同场景需求,通过标准化的数据开放平台提供数据服务。该平台支持多种访问方式,包括API接口、数据下载服务和在线查询工具,用户可根据自身需求灵活选择。同时,平台采用分级授权机制,确保数据安全与合规性,不同级别的用户可获取相应权限的数据资源。在数据格式和结构方面,公司采用统一的标准化存储方案。所有数据均以通用格式(如JSON、CSV、XML)存储,并遵循一致的数据模型和元数据标准。这种标准化处理不仅便于数据的处理和分析,还支持跨平台、跨系统的数据集成与共享。例如,数据分析团队可直接使用标准化数据进行建模,而无需额外的格式转换。3、数据资源管理与技术投入数据资源加工维护公司建立了完善的数据资源加工与深度治理体系,经过7层梯度清洗,将原始数据加工为高纯度、高价值、高安全、高可用的数据资源。去噪清理层公司通过自主研发的数据清洗工具,基于特定规则的信息清洗和过滤,针对数据中冗余、广告、隐私等不良信息,设计了1,000余种的清洗规则,如删除广告、无关的文本、图像中的干扰元素、电头识别、图说提取、底部非正文、垃圾信息过滤等,确保深度清洁。不仅滤除了大量的垃圾文本和乱码,还确保了文本语料的统一和规范,为后续的数据分析与应用奠定坚实基础。去重净化层识别并删除数据集中的重复记录,确保数据的唯一性。通过比较记录中的唯一标识符或基于自然语言处理(NLP)和机器学习技术,深度分析文本内容,识别其中的重复或相似部分来实现去重。标准化层将不同来源、不同格式的数据转换为统一的格式,以便于后续的处理和分析。这不仅提高了数据的可用性,还减少了因格式不一致带来的错误和混淆,如将日期格式、数值单位、文本术语、表述方式进行标准化等。举例:假设系统从不同的数据源采集的网页正文日期的格式各不相同:数据源1:2025-04-12(ISO格式)数据源2:04/12/2025(美式格式)数据源3:12/04/2025(英式格式)为了便于后续处理和分析,系统需要将这些日期自动统一转换为一种标准格式,比如ISO格式(YYYY-MM-DD)。这样,所有日期都变成了:2025-04-12启发式规则层基于业务经验和启发式规则对数据进行进一步处理。例如,根据业务逻辑修正数据中的异常值,或通过规则推断缺失值。例如某一产品的拥有情况可能和家庭收入有关,可以根据调查对象的家庭收入推算拥有这一产品的可能性。“毒性”过滤层通过文本识别、视觉计算以及“毒性”知识库等技术手段检测并过滤数据中的有害内容,确保数据的合规性和安全性。在构建高质量权威数据库时,这一过程尤为重要,因为它涉及到信息的真实性,举例如下:虚假信息检测:利用人工智能技术检测新闻中的虚假信息,可自动发现可疑线索并进行认证,大大降低谣言可能带来的危害。敏感内容过滤:通过自研的审校大模型,对文本、图片、视频等多模态内容的敏感信息自动过滤。恶意评论过滤:新闻媒体的评论区常常会出现恶意评论,通过文本有害内容检测和OCR识别技术,可以自动识别文本、图片等多模态内容并过滤违规内容。知识强化层结合知识图谱、领域知识等对数据进行增强处理,提升数据的语义丰富度和关联性。例如,通过知识图谱补充数据中的实体信息和关系信息。合规脱敏层对数据进行脱敏处理,确保数据符合法律法规和隐私保护要求。例如,使用加密、掩码等技术对敏感信息进行脱敏。数据安全保护公司高度重视数据安全,采取了多层次的安全保护措施。在技术层面,公司采用国密加密技术、访问控制技术和数据备份技术,确保数据在存储、传输和使用过程中的安全性和保密性。在管理层面,公司建立了严格的数据安全管理制度,明确数据访问权限和操作流程,确保数据的合法合规使用。公司还通过定期的安全审计和漏洞扫描,及时发现并修复潜在的安全风险,保障数据资源的安全。人才与关键技术投入在人才方面,公司拥有一支专业的数据采集、治理、研发、运营和安全保障团队,成员具备丰富的行业经验和专业技能。公司持续投入资源进行人才培养和团队建设,通过内部培训、外部交流和学术合作等方式,不断提升团队的专业水平。在关键技术方面,公司一方面将最新的OCR识别、审校大模型、视觉计算等技术积极应用于拓思数据平台,用于提高数据治理的效率与质量;另一方面将最新的拓天大模型积极应用于网察、数星、数家等数据场景服务产品中,以提升数据服务产品的智能化,不断优化用户体验。4、数据资源应用与运营情况报告期内,公司持续拓展数据采集的广度与深度,致力于提升数据治理的精细化水平,积极探索数据服务的创新应用场景,持续丰富数据产品矩阵,全力释放数据的潜在价值,以实现数据价值的最大化。本年度,公司对以下数据服务产品进行了持续迭代:网察大数据平台:基于态势感知的新一代网络舆情监测分析SAAS服务平台。移动端的全面的升级开发:让用户在移动端也能轻松查看舆情监测的实时动态,包括舆情监测、预警模块,支持在线筛选以及推送消息的提醒,支持移动端与网页端的数据同步。新老版本产品迁移拓天·舆情大模型的高效微调与深度适配:基于大模型推出了舆情分析助手和舆情报告助手向量数据库部署调试数据挖掘优化升级:敏感分类、情绪分类、行业分类、垃圾文识别过滤、知识库沉淀、治理数家资讯平台:专注于内容资讯的“数据专家”。数据开发:新增数据项、新增接口、新增种子资源、新增实体知识库构建、持续实体信息虚实打通、新增服务模式等。大模型增强:实现自动翻译模块流程改造,并引入大模型翻译组件;基于大模型的事件多要素抽取、情感分析、关键词和摘要等打标服务升级;跨模态检索;专题事件报告及传播分析报告自动生成;开发网察助手。数星产业大脑:主要面向金融、政府、企业等机构,提供洞察产业态势、监测企业风险、获取企业商机等数据服务。重点研发审查标准产品+大模型应用服务、大模型合成风控数据、大模型产业线索生成服务。大模型增强:大模型风控数据生成上线,降低50%人工成本,提升200%信号覆盖度。产业大脑应用,大模型企业上链,提升200%准确率。在数据流通方面,公司数据服务类OpenAPI已在北京、上海、深圳、郑州、湖南、浙江、贵阳、西部等数据交易所挂牌。(三)行业应用1、数字企业报告期内,尽管宏观经济环境复杂多变、行业竞争愈发激烈,数字企业的业绩却逆势增长,该版块本年度营业收入为3.66亿元,同比增长17.02%,新签约企业级客户如中国建筑、中交集团、招商局集团、国家能源集团国际工程公司、精工控股集团、深圳机场、浪潮软件等十余家。目前,公司已成功服务了32家中央企业,在全国央企版图中占据了32%的比重,成功助力多家头部企业实现细分领域的数字化转型。该板块的业务呈现分化态势。首先,行业周期和市场格局调整导致传统内容管理和企业融媒宣传市场逐渐饱和,投入规模随之收缩,但公司依靠存量客户的系统运维收入保持稳定。其次,在企业声誉风险管理业务方面,公司精准把握企业刚需,凭借专业的舆情监测及危机应对方案,助力多家知名企业实现危机提前精准预警,企业客户存留率高达85%,比去年提升了4.9%。同时,公司积极开展舆情生态网络建设,与上海证券报社有限公司在人工智能、网络舆情、数字化营销等方面展开了深度战略合作。上海证券报作为新中国第一份提供权威金融证券专业资讯的全国性财经日报,与全国5,300多家A股上市公司,和银行、保险、基金、证券、信托等金融机构,及地方政府、监管部门、要素市场、产业园区、行业协会等建立了广泛而深入的服务与合作关系。双方联合打造“上证鹰”舆情智能监测服务平台,致力于为上海证券报的用户提供及时、有效、个性化的全媒体大数据舆情监测和处置服务,协助其用户进行声誉风险管理。其中,拓尔思主要提供平台建设、系统迭代、数据运营和技术支持,上海证券报负责该平台的运营推广。“上证鹰”系统主要面向上市公司董监高,证券部、战略部,基金公司基金经理等用户,围绕市值管理、品牌口碑管理、竞争对抗、需求及用户反馈收集等用户需求,基于拓天·舆情大模型提供智能化的舆情管家服务。用户可通过“一句话”的交互方式,及时了解公司的舆情预警、热点追踪、舆情对比、行业分析、舆情报告、应对案例、决策参考、报告生成等。“上证鹰”自2024年10月16日正式发布以来,已开通试用帐号100多个,正式转化用户32个,其中50%以上为上市公司,如寒武纪、国联股份、郑煤机、林洋能源、天通股份等。第三,随着大模型技术的迅猛发展,企业的数智化创新需求也开始兴起。公司凭借出色的拓天大模型工程化落地能力,企业新型智库的创新应用场景新签项目5个,初步构建起极具潜力的增长曲线,有望持续为公司拓宽盈利边界。2、开源情报报告期内,国际地缘政治局势复杂多变,全球政治经济格局深度调整,国家海外利益保护的紧迫性与重要性愈发凸显。在此背景下,公司精准锚定开源情报业务发力,该版块业绩大幅跃升,本年度母公司的开源情报营业收入约2,489万元,同比增长111.89%。首先,公司加大了全球开源情报数据收集与治理的投入,涵盖全球主流新闻媒体、社交媒体、政府公开文件、学术研究成果等多类型数据源,覆盖全球196个国家与地区,数据总量超5,000亿条,支持130多种语言,确保数据的全面性、及时性与准确性,为客户提供坚实的数据基石。报告期内,国家海外利益保护相关的数据服务收入增长显著,超过1,300万,同比增长550%。其次,公司持续优化情报分析产品,融合人工智能、机器学习与自然语言处理等前沿技术,通过产品迭代深度挖掘和智能分析海量数据,精准提炼高价值情报。依托自建的全球开源情报数据中心、天目·瑶光装备数据库、天目开源情报服务平台、拓天大模型、事件分析平台及情报分析师团队等核心平台,公司综合服务能力优势凸显。结合对防务客户需求的深刻洞察,公司打造定制化开源情报解决方案,提供从监测、分析到风险预警与决策支持的全流程一站式服务。该版块业务主要由开源情报数据推送服务、开源情报数据治理服务、开源情报报告服务、开源情报分析与研判平台私有化部署四种模式构成,已形成“知识服务领航、数据服务支撑、平台服务保障”的服务格局。公司在该领域的竞争优势进一步提升,防务类新客户拓展数量90家,其中93%为开源情报数据和知识服务客户。3、数字政府报告期内,根据《2023-2024年中国信息化市场中标分析》报告显示,2024年期间国家及省级、市级层面已出台近350个数字政府相关政策文件,覆盖全国大部分省份,政策密度进一步提升。在政策引导下,数字政府项目遍及政务服务、一网统管、数据治理等方面,需求稳步释放,数字政府投入呈现出总体增长但项目小型化的趋势,由于预算分散到更多基层和小型场景,项目数量同比增长13%,略超金额增速,单项投入有所降低,强调“场景牵引”而非单纯追求大项目规模。公司数字政府业务版块的业绩保持平稳,本年度营业收入为1.74亿元,同比增长1.74%。其业务也呈现分化趋势:一方面,公司在政府网站集约化、金融监管、政务舆情等成熟领域,新项目建设投入收缩,基于庞大的政府用户基础:80%的中央和国务院机构,64%的省级政府,52%的地市政府以及400多家地方金融监管单位,公司在已有系统的运维方面获得的营业收入保持平稳,形成坚实的业绩基本盘。另一方面,全国政府网站在2024年信息发布总数达3,212.3万条,全国政务新媒体账号总数为88,826个。受益于年度政府网站绩效评估,政务网站与新媒体矩阵传播效应亟待量化。在此背景下,政务新媒体传播数据推送服务,为该业务板块收入提供重要补充,相关数据服务需求呈增长态势。第三,DeepSeek掀起全国政务系统大模型应用热潮,各地积极引入,借力AI优化政务服务。公司依托拓天·政务大模型,已向自然资源部、贵州、广西、深圳等地政府单位提供智能政务问答助手服务。同时,审编校对、辅助办公、政策分析等智能助手应用,也在十余个部委及省市单位深度试用,政务大模型应用有望成为新增长引擎。4、融媒体报告期内,受所处行业周期性波动这一客观因素的深度影响,公司融媒体业绩面临较大挑战,整体呈现收缩态势,本年度营业收入为7,647万元,相较于去年同比下滑21.78%。首先,传统融媒体平台建设需求呈现阶段性调整,市场投入有所缩减,但公司运维团队凭借精湛的专业技术、高效的响应机制,为众多传媒客户提供了稳定可靠、高效优质的运维服务,既保障了相对稳定的技术运维基本盘收入,也有望在行业回暖时抢占先机。其次,在数字化浪潮下,融媒体蓬勃发展,其运营复杂,对信息即时性、精准性要求颇高。融媒体平台要汇聚、分发海量信息,满足受众多变需求,就得确保内容优质,比如新闻类融媒体,遇全球性自然灾害、国际政治变动等突发大事,数据推送服务能迅速整合权威媒体、社交媒体、官方发布等多渠道一手信息,经智能算法处理后,即刻推送至编辑终端。编辑据此快速产出深度报道,抢时效领先同行。数据服务作为保障融媒体核心系统的关键,至关重要。本年度公司融媒体的数据服务营业收入为1,959万元,比去年同比增长20%。该增长一方面源于客户需求的稳定增长,另一方面主要源自公司长期在数据采集、算法优化、服务定制等方面的深耕。第三,当前主流媒体正面临系统性变革的迫切需求,重点要解决三大痛点:一是智能化应用水平提升面临挑战,二是数据转化与利用能力急需强化,三是内容生产能力有待全面提高,生成式人工智能技术正在颠覆传统媒体的内容生产和分发模式。公司基于拓天·媒体大模型通过智能编辑助手将数据化和智能化融入媒体的策采编审发评全业务流程,目前,该创新应用在人民日报社、中国日报、中国环境报、中国青年报、人民出版社、解放军出版社、国家大剧院等多家权威单位成功落地。其中,公司助力中国环境报在生态环境领域构建了首个以DeepSeekR1/V3为基座模型,深度融合生态环境领域权威数据,集成智能写作、智能校对、公文助手、报告撰写、产业分析等功能模块于一体的大模型服务平台,标志着中国环境报社发展迈入智能驱动新阶段。拓尔思长期为新华社、人民日报社、中央广播电视总台等国家级媒体提供多个核心业务系统技术支撑,显著提升了媒体业务场景效能,同时,公司也是新华社媒体融合国家重点实验室的智能数据创新基地的联合建设方。公司融媒体用户已经覆盖了72%的中央媒体,61%的省级媒体,40%的行业媒体。当下,融媒体信息化建设正从以软件产品为主,大数据服务为辅向数智化服务模式转变。新技术赋能之下,内容创作、分发及用户互动等环节将被重塑,市场需求有望迎来爆发式增长。随着大模型技术的不断成熟与普及,基于公司深厚的融媒体业务底蕴与客户基础,公司已抢先布局,将大模型深度融入融媒体全业务流程与生态,有望在媒体行业处于周期向上的转折时机,开启新的业绩增长曲线。5、金融科技报告期内,公司金融科技板块面临诸多挑战,受宏观经济环境复杂多变以及金融行业周期波动的双重影响,信息化建设呈现用户自建为主,市场需求在短期内出现收缩,客户预算普遍收紧,部分项目推进受阻整体业绩呈现下滑态势。信贷风控业务:传统系统平台建设需求呈现阶段性调整,市场投入缩减,部分银行客户因自身战略调整,放缓了数字化升级项目的步伐。该领域的信息化业务由平台投入型转向以常规运维+数据推送服务为主,项目客单价变小,但用户粘性很强,数据服务的收入增长保持稳定。同时,公司也在积极调配内部资源,拟定并实施一系列针对性的应对举措,如加大信贷数据运营与治理,引入大模型技术,强化金融风控知识的整合与实时数据的更新能力,有效突破传统大模型在金融风控领域的知识局限性,大幅提升信贷风控预警信号的早报率与准确率,力求在后续阶段能以大模型应用助力该板块重回稳健增长轨道,持续为公司整体发展贡献坚实力量。目前,智能信贷风控助手已在平安银行、渤海银行、农业银行等项目中成功落地。消费者保护业务:当前监管态势持续收紧,国家监管对金融机构实施精细化、内卷式评分体系,银行等金融机构面临严峻的消保审查与投诉压降双重压力。在此背景下,机构纷纷加大金融消保信息化投入,驱动该细分市场呈现上行趋势。公司凭借深厚技术沉淀,消保审查产品、投诉工单产品以及消保审查模型、消保归因标签模型等已逐步走向成熟,产品稳定性与精准度不断提升,有望充分受益于市场扩容,斩获可观收益。目前,智能消保助手已在招商银行、民生银行、浙商银行、国投信托、浦发银行、兴业银行、中国银联、百年人寿等消保投诉、消保内容审查项目中成功实践,助力银行营销合规高效开展,切实维护金融市场秩序与消费者权益。产业数据及分析业务:公司加大了产业数据治理与运营投入,并于2024年4月率先接入DeepSeek作为拓天·金融大模型的基础模型,利用大模型优化产业与企业数据上链质量,准确率提升了200%。本年度产业数据服务的营业收入为1,250万元,同比增长342%,在行业整体承压的大环境下逆势上扬,彰显持续发展动力与潜力。拓尔思的金融用户已经覆盖了5大国有银行、3大政策性银行、92%的股份制商业银行以及中国证监会、国家金融监督管理总局、上交所、深交所。公司立足长远发展,持续深耕人工智能技术研发领域,全力优化金融创新产品。伴随行业周期稳步推进,有望开启全新增长曲线,深度释放数据价值。6、公共安全在复杂宏观经济环境下,此业务版块的信息化项目预算投入减少或延迟,本年度公司在此版块的项目主要聚焦数智赋能提高新质战斗力。公安:本年度公司在公安版块的营业收入为1.10亿元,比去年同比下降27.67%,主要是子公司天行网安公安网络安全业务受行业周期波动影响,客户收缩网络安全预算规模,项目延期情况突出,导致收入大幅下滑。剔除天行网安公安业务调整因素后,母公司公安业务板块实现营业收入4,375万元,同比增长26.26%,展现出强劲的增长势头。公司持续深耕公安领域,重点发力大模型赋能情报研判、情指行一体化等核心方向,进一步巩固技术优势,推动业务规模稳步扩张。这一亮眼增长不仅体现了公司在公安信息化领域的深厚积累,也彰显了其在新兴技术应用上的创新活力。拓天·公安大模型接入DeepSeek后,结合实战应用场景进行了参数精准蒸馏和专业知识高质量再治理,并将推理能力与非推理能力整合到同一个模型中,主要聚焦警情研判、侦查打击、风险防控、安保保障、应急处置、执法办案等多个场景提供创新服务。目前,拓尔思将继续深耕垂直领域,针对公安场景的特殊需求,持续优化模型性能,拓展更多应用场景,帮助警方更好地应对复杂的社会治安挑战。目前,该应用已经在多个地市公安机构成功落地。网信:公司已稳固确立在智慧网信领域的领军地位,即便在行业整体信息化投入不足的背景下,本年度网信业务板块仍展现出强劲的增长态势,合同金额达2,924万元,同比增幅达23.38%。区域市场方面,公司保持了良好的增长势头,成功拓展了2家省级网信用户,并加速向市级市场渗透,新增16家市级网信用户,标杆省份的网信业务已全面渗透至省、市、区(县)三级市场,业务版图持续扩大。该板块的核心业务聚焦于舆情一体化综合研判指挥系统,该系统具备高度成熟的产品特性和强大的可复制性,有效降低了交付成本,从而在行业中占据了显著优势。报告期内,公司依托拓天·舆情大模型,对网信业务进行了深度应用创新,通过构建“全、精、活、深”四位一体的服务矩阵,在原有日常监测、专题分析、预警中心、舆情报告、在线检索及短视频分析等核心功能基础上,为用户提供了基于Chatbot、独立应用、AI伴随等多样化产品形态的创新体验。这一创新举措助力用户实现了从监测、分析到决策的全流程业务管理,为网信用户构筑了从风险预警到战略决策的全方位智慧防护体系,充分彰显了AI时代舆情治理的标杆价值。7、出海业务报告期内,公司出海业务取得实质性进展,海外营业收入达924万元,同比增长55.04%。公司依托全球化战略布局,聚焦两大核心业务板块推进出海业务:一方面,公司依托香港全资子公司拓尔思国际有限公司立足香港辐射全球,重点面向中东、东南亚、拉美及一带一路国家的政府、大型企业、智库等机构提供开源情报、互联网资讯分析、社交媒体舆情监测等服务。另一方面,针对中企出海需求,主要提供数据安全服务以及海外利益风险评估综合服务等,助力政府和出海中企加快形成并有效提升海外安全保障服务能力,建立起国际综合信息收集预警、分析研判能力,构建覆盖事前预防、事中响应、事后复盘的全周期安全保障体系,帮助出海中企补齐海外利益保护的短板,助力企业提升海外风险防控水平。目前,公司已与香港某纪律部队成功续签了二期合同。此次合作将聚焦于深化多元新型网络诈骗犯罪领域的开源情报服务,进一步强化公司在粤港澳区域市场的渗透能力。(四)软件平台1、出海新品①Tate-A-TateTate-A-Tate(https://tate-a-tate.com)是拓尔思公司新研发的一款面向全球用户的智能体在线开发平台,支持无代码创建品牌化的AIAgent。用户可以通过预构建模块定制代理,实现端到端服务,并通过订阅方式盈利。此外,该平台支持多平台发布,助力用户快速将AI服务推向市场。无代码开发:用户无需编程知识,即可通过平台的可视化界面和预构建模块快速创建品牌化的AIAgent。高度定制化:支持对Agent的每个细节进行定制,包括工作流程自动规划、工具配置等,以满足不同业务需求。多平台发布:用户可以将开发的Agent轻松发布到Discord、Slack、Telegram等多种平台上。盈利模式:提供订阅服务,用户可以通过平台将开发的AIAgent进行盈利。预构建模块:平台提供多种预构建模块,如知识容器和表格生成等,用户可直接拖拽使用,快速搭建工作流。数据集成:支持用户将自己的数据拖拽到平台中,与预构建模块结合,创建个性化的解决方案。测试与优化:用户可以在发布前对工作流进行预览和测试,确保其功能和性能符合预期。这些功能特性使得Tate-A-Tate成为一个强大的工具,适用于个人开发者、业务分析师、产品经理、业务专家、AI爱好者等不同职业背景的用户。②GlobalInsight全球资讯洞察GlobalInsight是一款实时全球资讯聚合与智能洞察平台,主要面向东南亚、中东、拉美等地区,助力其B端G端用户精准把握全球政经态势与行业趋势,该产品于2024年12月正式发布上线。多源数据处理和融合分析:覆盖全球主流媒体,一站式汇集账号、贴文、评论、图片、地理位置、关系等多源异构数据,实现数据的快速融合、关联分析。多语言翻译与跨语言检索:用户以一种语言提问,可检出多种语言描述的相关信息。综合了文本处理、语言情报学、信息检索与机器翻译等技术,综合性强、富有挑战性。动态可扩展的社交关系、实体关系构建:面向互联网开源数据,构建包含人、地、事、物、组织、行为等要素的动态可扩展的关系图谱,帮助用户对数据、情报信息进行深度挖掘和全面理解。实体目标虚实打通和全景洞察:通过实体多平台账号关联,实现现实身份与虚拟网络账号的无缝对接,进而获取目标的相关事件、行为关系、位置信息等多维度分析结果数据,实现实体目标的全景洞察。2、拓天大模型一体机拓天一体机是拓尔思与华为联合推出的一款高性能、全栈国产化的大模型一体机,其以昇腾算力一体机为载体,具备高性能、低功耗的计算能力,精准对接人工智能模型训练和推理的需求。它内置拓天大模型与DeepSeek双引擎模型及特种场景常用算法,用户只需按照智能向导操作,导入专业知识库,添加行业指令,可视化编排智能体开发,即可快速完成特种行业不同场景的大模型训练与应用配置。支持特种行业用户根据业务特性深度定制模型功能,突破传统应用边界,持续释放AI潜在价值,拓天一体机适用机房部署,覆盖多种部署场景。3、人工智能平台①智拓人工智能平台通过将机器学习、深度学习、强化学习及大模型训练等技术整合到同一平台,构建高效、灵活的技术生态,为用户提供一站式的智能化解决方案。报告期内,研发团队对该产品进行了以下迭代:自主研发容器化分布式计算框架,摆脱对Kubernetes等开源框架的依赖,降低运维复杂度,提升系统的自主可控性与稳定性,为大规模计算任务提供可靠支撑。统一从算法开发、模型训练与推理到应用部署的全生命周期技术规范,打通与第三方厂商的技术壁垒,提升平台的开放性与兼容性,促进生态合作与技术共享。基于多个重点项目的实践经验,深入挖掘用户核心需求与痛点,持续优化产品功能与性能,确保产品能够切实解决用户实际问题,提升用户体验与满意度。②事件分析平台公司进一步完善了大模型推荐和虚实事件库推荐等功能,新增了精确地点预测和事件征兆分析功能,用以不断提升开源情报业务中事件研判与预测的准确性。针对海外项目需求,开发多语种版本,进一步迭代事件态势、事件热点、事件专题、事件推演、AI问答助手、报告生成等模块的设计与开发。③自动校对服务通用型校对模式:提供基础的文本校对功能,包括拼写检查、语法修正和标点规范,适用于广泛的文本编辑需求。以规则+小模型校对引擎作为默认校对方式,可提供快速文本校对能力,但在语法是否等长等错误类型的能力偏弱。大模型校对模式:利用先进的自然语言处理技术,对文本进行深度分析和校对。它能够理解上下文,提供更精准的语法和风格建议,尤其适合专业写作和学术出版。提供规则+大模型校对引擎,可以提供更准确、更智能的校对服务,但校对性能对硬件要求较高。大模型事件核查系统:专门用于验证文本中提及的事件和数据的准确性。它通过与数据库和可信来源的交叉验证,确保信息的真实性和可靠性。采用知识库+大模型,针对领导人讲话的引用以及知识理解类错误提供能力支持,需要收录并加工相关知识库。④智眼平台OCR:优化PDFtoWORD、多语种OCR识别。基于版式识别、表格结构识别、公式识别和OCR,实现PDFtoDOCX,在WORD中体现标题、表格、句间公式及插图。多模态:优化基于轮廓检测的文生图技术;优化图像生成文字描述。通过人物轮廓检测、背景移植和光线还原,得到更加逼真的图片生成效果。视频智能识别:优化视频相似度检索,集成视频动作识别和智能切片功能。事件平台:实现轨迹识别和预测。信创:适配华为NPU平台和RK3588平台。发明专利:一种基于深度学习的超分辨率图像小目标检测方法。4、数据软件平台报告期内,公司持续对数据基础设施软件平台进行迭代研发。①大数据中台数据中台:提升数据管理、加工、使用的效率接数据:从3分钟1张表到5分钟整个库(几百张表):100倍+流处理:优化引擎缓存,启动速度从分钟级提升到秒级批处理:DAG模式,治理效率提升90%全链路监控:吞吐量提升10倍,入库速度突破1亿条/小时能力中心:提升能力生态的建设和管理增强对不同协议能力的兼容支持、增强对能力的管理和管控、提升功能使用易用性技术中台:提升DevOps、云原生的赋能能力增强生态适应支持、适配支持更多操作系统:RockyLinux、AlmaLinux、Ubuntu等②海贝向量数据库新增备份与恢复功能、镜像数据库(读写分离)支持、管理台国际化支持、TRS引擎mmap优化、向量增强优化等③海贝图数据库海贝图数据库是公司新研发的一个可靠的分布式、线性扩容、性能高效的图数据库。支持存储与计算分离,通过增加节点轻松扩展存储容量和计算能力,支持RAFT协议下的数据强一致,自动数据分片与负载均衡,支持多种类型的图计算算法与灵活的查询语言,可与Hadoop、Spark、Flink等工具集成,处理复杂数据任务,支持图数据直观展示和交互式分析。④RAG检索平台增加视频搜索、增加多种数据切分模式、增加各种文档抽取功能、问答应用开发、整体联调5、天目开源情报平台新版开发与升级大模型功能增强:开发情报分析助手、情报报告助手开源情报专题运营增强开源情报实体持续治理(四)服务模式软件产品+云服务+数据服务+解决方案+专家咨询(五)采购模式公司采购内容包括软件安全产品、技术服务等业务实现过程中所需的软件、硬件、材料、附件、工具,其中IT软硬件设备包括网络设备、安全设备、主机设备、数据库软件和操作系统等。IT基础设施部负责受理公司内部软硬件采购申请,提交审批,组织供应商评价工作,执行采购;商务部负责受理给顾客代购的软硬件采购申请,处理客户提交的审批,供应商监督、评价及执行采购等;行政部负责公司办公用品、产品介质光盘的采购,并负责相关供应商评价;市场部负责公司印刷品的采购,并负责相关供应商评价;公司主管领导负责对公司内部采购业务的软硬件、办公用品等合格供应商进行审批;申请部门/人员配合采购实施人员对采购产品进行验收、保管及维护;销售部根据服务项目的需求提出采购申请。(六)研发模式公司研发人员近900人,在北京、成都、广州设立了8个研发机构(北京研发中心、数字经济研究院、天行未来实验室、资讯和融媒体产品中心、舆情和网信产品中心、金融和产业大脑产品中心、成都研发中心、广州知识图谱研究院),拥有3个北京市重点实验室,是国家重点实验室数据智能创新研发基地,承担过20余项国家级科研项目,包括多项国家重点研发计划,已与多所知名高校建立了联合实验室/战略合作关系,形成产学研深度合作生态。公司还与新华社国家重点实验室、北京信息科技大学三方共建“媒体融合生产技术与系统国家重点实验室数据智能创新研发基地”,面向国家重大需求筑牢科研基础,旨在推动创新链、产业链、资金链、人才链深度融合,围绕业务需求痛点开展应用研发。根据研发总规划、产品研究和开发计划,公司研发部门进入产品立项和项目策划过程,撰写产品研发的《项目立项报告》和《项目计划书》,提交项目立项申请。项目获批后,正式启动产品研发工作,《项目计划书》作为项目整个研发过程中的指导依据,是项目验收的主要依据。完整的研发流程包括立项报告、需求分析、关键技术突破、产品设计编码与测试(包含但不限于单元测试)、系统测试、变更控制、研究成果报告撰写、项目验收和产品发布、评审、专利和软件著作权申请等过程。(七)销售模式公司在全国设立了30余家分子公司和办事处,立足香港已进入海外市场,布局国际化业务,并与行业头部企业建立了广泛的战略合作伙伴关系,包括央国企、互联网平台公司、行业集成商等。公司软件产品、云和数据服务的销售主要是通过直接向客户销售以及委托合作伙伴销售相结合的方式进行。多年来,公司以高质量的产品和服务获得大量的行业用户认可。基于这些客户逐步新增的业务需求,和他们在行业内的口碑传播,以及公司积极进行行业营销活动的作用下,形成的销售机会可以驱动公司业绩在稳健增长的基础上随着行业市场同步发展。本年度,自与华为达成战略合作以来,公司多次受邀参加华为全国及全球人工智能大会,并出席近十场地方性重要活动,充分展现了双方在人工智能领域的战略契合与技术共鸣。双方联合推出的拓天大模型一体机,已成为合作的标志性成果,并在多个安全领域项目中进入深度试用阶段。与此同时,公司和华为制造与大企业军团在公安、政府及大型企业领域持续展开深度沟通与合作,项目推进有序且成果显著,在途订单近千万。近期,双方更是在加速推进普教大模型一体机的研发工作,致力于为教育领域提供更高效、更智能的解决方案。报告期内,公司实现营业总收入77,703.45万元,较上年同期同比下降0.59%;实现归属于上市公司股东的净利润-9,414.56万元,较上年同期同比下降358.17%;实现归属于上市公司股东的扣除非经常性损益的净利润-17,053.32万元,较上年同期同比下降7,121.78%。报告期末,归属于上市公司股东的净资产为412,523.98万元,较上年末同比增长23.06%。公司业绩变化的主要原因如下:1、主要系子公司天行网安计提商誉减值9,067万元,广拓公司计提商誉减值801万元,合计9,868万元导致。其中报告期内,天行网安所处网络安全行业相关需求有所减缓,市场规模增速减缓,天行网安营业收入及利润不及预期。综合客观因素和未来业务发展的谨慎判断,根据《会计监管风险提示第8号——商誉减值》及《企业会计准则第8号——资产减值》的相关要求,公司聘请具有从事证券、期货相关业务资格的评估机构及审计机构进行评估和审计后,确定公司2024年度对其计提商誉减值。2、2024年作为公司全线AllinAI战略换挡的关键年,公司主动优化盈利结构,加大了人工智能和数据要素领域的研发投入,阶段性降低短期利润以筑牢长期竞争力:一是公司整体研发支出同比增长8.16%,占总营收比重由去年39.52%提升至43%,新增专利15项,为未来三年产品升级奠定基础;二是数据资产的相关研发支出占总营收比的5.03%,进一步加大公司高质量数据的竞争力,提升数据价值释放潜能;三是实施精品项目策略,主动淘汰低毛利业务,如减少传统开发型项目,通过项目精选机制释放更多人力资源投入大模型项目中,短期亏损承压是主动选择的战略蓄能,预计技术红利将在2025-2026年逐步释放。分业务来看,公司业绩变化呈以下特点:1、大模型应用密集落地,智能体加速渗透根据《毕马威全球财务智能化调研报告》显示,当前企业用于人工智能技术和解决方案的支出占IT预算的平均比重为8.6%,未来三年将跃升至13.6%。在此背景下,公司人工智能软件产品及服务实现收入2.58亿元,同比增长8.99%。其中,大模型应用实现营业收入1.26亿元,同比增长13.87%,客户覆盖政务、媒体、金融、公安、智库、专利等行业,累计交付大模型和智能体标杆项目40余个:数字政府:拓天·政务大模型在自然资源部、贵州、广西、深圳等政府成功落地,目前主要应用于政务智能问答。舆情治理:拓天·舆情大模型已在公司网察大数据服务平台成功运行,服务了数百个订阅用户,同时,也已在国家发改委、新华网以及多个省级网信办等权威单位中得到应用。开源情报:拓天·开源情报大模型已在多个防务部门及国防大学、国防科技大学等机构中投入实战,帮助提升开源情报分析效率。媒体融合:拓天·媒体大模型赋能人民日报、中国日报、中国环境报、中国青年报等多家权威单位的内容生产,推动媒体内容生产提质增效。金融科技:拓天·金融大模型在中国银行、农业银行、招商银行、民生银行、浙商银行、国投信托、浦发银行、平安银行、渤海银行等金融机构的产业投研、信贷风控、消保项目等不同场景中得到成功应用,帮助金融机构提升对公业务的市场竞争力。审核校对:拓天·审校大模型在人民出版社、解放军出版社、国家大剧院等采编系统中得到应用,对出版内容进行实时审校,全面提高文字质量。智慧警务:拓天·公安大模型已在多个地市公安机构成功落地,实现了对警情研判、指挥调度、公文写作、数据分析、情报挖掘、政务服务、侦查打击、风险防控、执法办案、智能安保、应急处置等公安业务场景深度赋能。智库研究:拓天·智库大模型在中国医学科学院医学信息研究所、国网能源研究院、南京图书馆以及数所大学院校等单位成功落地,提升决策效率,助力智库在竞争中突围。专利审查:拓天·专利大模型赋能国家知识产权局助力国家持续提高知识产权的审查质量和审查效率。随着人工智能应用范围的持续扩展,当前,公司的大模型与智能体应用已在多个行业树立了标杆示范,不仅帮助B端、G端用户实现降本增效和优化决策,还显著提升了投资回报率。根据IDC于2025年4月7日发布的《全球人工智能支出指南》,至2028年,生成式AI技术相关投资占比将提升至30.6%,中国AI领域总投资预计超过1000亿美元。行业头部企业在技术创新、知识产权和跨领域应用方面持续突破,推动AI技术向产业化纵深发展。面对千亿级智能化市场机遇,公司将继续深化AllinAI的战略布局,以技术创新为核心,积极拓展市场,把握未来发展先机。2、数据服务突围,开源情报现新机大数据软件产品及服务实现收入2.91亿元,与去年同比小幅下降7.05%。随着行业数字化转型进入深化阶段,数据基础架构搭建需求趋于平稳,导致大数据软件产品新签项目数量减少。与此同时,数据服务实现营业收入8,514万元,同比增长13.87%。这一增长主要得益于客户IT预算的结构性调整,更多资金向数据服务和运维倾斜,推动了大数据服务业务的持续扩展。当前,国际竞争日益激烈,全球市场扩张促使各国在经济、安全与技术领域展开多维度竞争。在此背景下,国家发展及企业出海面临诸多挑战,包括地缘政治风险、国际法规限制以及复杂的市场环境。为了应对这些挑战,我国有关政府、防务机构及中国出海企业对开源情报的需求显著增长。本年度,公司开源情报数据实现营业收入3,049万元,该版块下,母公司的业绩增速最快,营业收入为2,489万元,同比增长111.89%。这一增长不仅反映了市场需求的快速扩展,也体现了公司在开源情报领域的技术优势和市场竞争力。公司拥有全球开源情报数据中心、天目.瑶光武器装备数据库、天目开源情报服务平台、拓天·开源情报大模型、事件分析平台、情报分析师团队等开源情报全栈服务能力,结合对客户需求的深刻理解,可提供从情报监测、分析解读到风险预警与决策支持的一站式服务,满足国际形势追踪与分析、目标国经济态势感知、防务政策制定参考、目标情报获取、技术趋势跟踪、危机态势感知等丰富场景下的开源情报需求。本年度内,公司新增防务类客户90家,其中93%为开源情报数据和知识服务客户。未来,公司将采取扩大全球互联网数据收集、加强数据精细化治理与运营、利用人工智能技术增强开源情报分析研判能力等措施,进一步巩固公司在开源情报领域的市场地位,实现该版块业务的持续增长和用户价值的最大化。3、出海业务持续拓展,海外营收创佳绩报告期内,公司出海业务持续突破,海外营业收入达924万元,同比增长55.04%。为进一步推动出海业务发展,公司定制了以下全球化布局:首先,公司依托香港全资子公司拓尔思国际立足香港辐射全球,重点面向中东、东南亚、拉美及一带一路国家的政府、大型企业、智库等机构提供开源情报、互联网资讯分析、社交媒体舆情监测等服务。拓尔思国际2024年在香港地区业务取得了重大进展,与香港某纪律部队成功续签了二期合同,深化多元新型网络诈骗犯罪领域的开源情报服务。公司拟对拓尔思国际进行增资800万美元,用于建设数据中心、扩充研发和商务团队、购置办公场所和办公设备、扩大办公规模,以增加公司拓展海外市场的实力。目前增资流程正在稳步推进中,增资完成后拓尔思国际注册资本将达到1,000万美元。其次,在人工智能驱动的变革浪潮中,公司正积极探索ToC市场的新产品和新商业模式。公司研发了一款面向全球用户的智能体在线开发平台Tate-A-Tate(https://tate-a-tate.com),支持无代码创建品牌化的AIAgent,通过多平台发布,助力用户快速将AI服务推向全球市场。Tate-A-Tate适用于个人开发者、业务分析师、产品经理、业务专家、AI爱好者等不同职业背景的用户。目前,该产品已正式上线,并已组建了具有海外工作经验的专业团队负责运营。公司期待在AI时代打造具有市场影响力的爆款产品,为公司在智能化领域的持续增长提供强劲动力。同时,公司推出了海外利益保护解决方案,主要面向出海的中国企业,为他们提供数据安全服务以及海外利益风险评估综合服务,建立国际综合信息收集预警、分析研判能力,构建覆盖事前预防、事中响应、事后复盘的全周期安全保障体系,帮助出海中企补齐海外利益保护的短板,助力企业提升海外风险防控水平。报告期内公司主要经营工作1、“拓天大模型”备案成功报告期内,基于在NLP领域30余年技术创新成果、10余年高质量数据和知识资产积累,以及在垂直行业10,000多家企业级用户应用实践,公司自主研发的“拓天大模型”,已正式通过生成式人工智能服务备案。“拓天大模型”拥有内容生成、多轮对话、语义理解、跨模态交互、知识型搜索、逻辑推理、安全合规、数学计算、编程能力和插件扩展十大基础能力,具有中文特性增强的可控生成技术、融合搜索引擎的生成结果可信核查、融合稠密向量的跨模态能力加强以及支持外界知识及时更新四大创新点。2、TRS海贝搜索数据库系统完成中国信通院向量数据库产品测试2024年4月,在中国信通院“可信数据库”向量数据库产品测试中,拓尔思TRS海贝搜索数据库系统顺利完成向量数据库产品基础能力测试。测试过程依据标准在基本功能、运维管理、安全性、兼容性、扩展性、高可用以及工具生态七大能力域的相关要求。测试结果表明,该产品在向量数据库的功能完备性、易用性、通用性等方面均符合标准要求。3、深度参与信通院搜索型数据库白皮书的编写中国通信标准化协会大数据技术标准推进委员会编写的《搜索型数据库白皮书》在“2024可信数据库发展大会”搜索与分析型数据库&多模数据库分论坛上发布。拓尔思深度参与了该白皮书的编写,从搜索型数据库的发展历程、核心技术、关键特性、应用场景等多个维度进行介绍,对搜索型数据库的整体发展现状以及未来演进趋势进行了概括总结,为技术创新、企业决策提供参考。4、发布《海外利益保护解决方案(2024)》2024年9月,公司依托强大的人工智能、大数据及数据安全技术,发布了《海外利益保护解决方案(2024)》。该解决方案基于拓尔思出海业务的实践,对中国海外利益保护新形势及公司在该领域的服务内容、技术优势及创新实践进行了详细阐述,为中企海外利益保护提供有力支持。5、拓尔思拓问管理平台通过“可信AI”大模型评估2024年11月,由中国人工智能产业发展联盟指导,南京经济技术开发区管委会主办,以“场景驱动产模融合”为主题的大模型产业创新发展大会在南京召开,会上正式发布了中国信通院首批大模型“样板间工程”优秀案例及“可信AI”大模型评估最新结果。拓尔思技术支持的平安银行“慧小喵”审计大模型应用入选“样板间工程”优秀案例,同时,拓尔思自主研发的拓问管理平台通过“可信AI”大模型评估,并在模型应用模块获得5级的综合评级。6、收获众多重磅奖项和品牌荣誉凭借深厚的技术实力与丰富的数智化应用场景,公司赢得了众多奖项和荣誉。
财务指标
财务指标/时间 |
总资产(亿元) |
净资产(亿元) |
少数股东权益(万元) |
营业收入(亿元) |
净利润(万元) |
资本公积(万元) |
未分配利润(亿元) |
每股净资产(元) |
基本每股收益(元) |
稀释每股收益(元) |
每股经营现金流(元) |
加权净资产收益率(%) |
企业发展进程