业务概述

2023年12月,国家发展改革委、国家数据局等部门联合印发《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,提出到2025年底普惠易用、绿色安全的综合算力基础设施体系初步成型,东西部算力协同调度机制逐步完善,通用算力、智能算力、超级算力等多元算力加速集聚。“构建全国一体化算力网络”、“加快智算中心建设”等政策纳入新基建战略,政策红利为算力产业注入强劲动能。 进入2025年,随着DeepSeek等新科技技术的持续发展,基于DeepSeek训练推理一体机等智能计算服务器开始大量投放市场。作为提供这种计算能力核心设施的智算中心,正逐渐成为业界关注的焦点,并被视为行业发展的重点建设项目。 此背景下,东久科技以20余年的IT基础底座建设经验,为政府及企事业单位提供以智算中心建设实施服务、AI算力一体机销售和智算中心运维服务为核心的全栈业务。

业务范围
智算中心建设实施服务
AI算力一体机销售
智算中心建设实施服务

智算中心运维服务专注于国内算力中心的日常运行维护,提供基础设施全生命周期管理、智能运维与自动化响应、行业化定制托管运维等全方位、专业化的服务。

智算中心建设实施服务业务范围
IT基础底座建设技术支持
硬件选型与配置技术支持
AI模型训练与智能应用开发技术支持
大数据与数据分析平台构建技术支持
云计算与虚拟化技术应用技术支持
IT基础底座建设技术支持
硬件选型与配置技术支持
AI模型优化与维护
· 对AI模型进行维护和管理,包括模型的更新、备份、恢复等操作。
AI模型训练

· 收集和整理训练数据,对数据进行标注和预处理。

· 对训练过程进行监控和调整,优化模型参数,提高模型的准确性和泛化能力。

智能应用开发

· 按客户需求,设计和开发智能应用程序,如智能客服、智能推荐系统、智能安防系统等。

· 将训练好的AI模型集成到智能应用中,实现智能应用的功能。

云计算与虚拟化技术应用技术支持
云平台搭建与部署
进行云平台的网络配置、存储配置、计算资源分配等,确保云平台的正常运行。
虚拟化技术应用
对虚拟机进行管理和维护,包括虚拟机的创建、删除、备份、恢复等操作。
容器技术应用
进行云平台的网络配置、存储配置、计算资源分配等,确保云平台的正常运行。
大数据与数据分析平台构建技术支持
数据采集与整合
设计和实施数据采集方案,从各种数据源中采集数据,如传感器、数据库、文件系统等。
数据可视化与报表
设计数据可视化方案将结果以图表、报表等形式展示。开发数据报表系统,实现数据的自动化汇报和决策支持。
数据存储与管理
构建大数据存储系统,对数据进行分类、分区和索引,提高数据存储和检索效率。
数据分析与挖掘
运用机器学习、深度学习等算法,对大数据进行分析和挖掘,发现数据中的价值和规律。
标杆案例
用户背景
传统机房GPU利用率不足30%,无法支撑千亿参数模型训练。
用户方案
部署“CPU+英伟达+国产化”混合集群,通过自研调度系统实现资源利用率提升至75%。
用户价值

通过机器视觉与数据分析技术,实现生产过程实时缺陷检测,不良品率从0.8%降至0.1%,年节省质检成本超100万元。

敏感数据100%私有化留存,满足金融/政务级安全要求。

分析设备运行数据预测故障概率,提前安排维护,减少停机时间30%以上。

支持多模态感知与自主决策,实现高危场景风险识别准确率达98%,事故率下降60%。

AI算力一体机销售专注提供浪潮、华为、H3C、安擎等国内优秀厂商的DeepSeek训推一体机产品。AI算力一体机凭借先进的技术架构和强大的性能,能够满足各类复杂的人工智能训练与推理需求,为医疗机构、科研机构、企业及政务领域等用户提供高效、稳定的计算支持,助力其在人工智能领域取得更优异的成果。

东久科技深耕IT基础设施建设领域二十余年,始终以客户需求为核心,构建了覆盖全场景的数字化服务能力。早期依托IBM等国际顶尖厂商的服务器、存储、网络设备及基础软件技术优势,累计为制造、能源、政府等20000余家客户提供标准化产品与场景化解决方案,在超大规模数据中心建设、混合云架构部署等领域积淀了丰富经验。

随着人工智能技术浪潮的推进,东久科技率先完成国产化转型布局,现已成为浪潮信息、华为昇腾、新华三(H3C)、安擎等头部AI服务器厂商的精英级合作伙伴。公司依托二十年行业洞察,重点打造面向大模型训练、智能计算中心等前沿场景的AI算力解决方案。

AI算力一体机各行业应用方向及价值
医疗

· 医疗影像分析大模型

· 本地化AI诊疗平台

· 专业知识库

“临床智能化”

政务

· 政务信息公开

· 政务民生服务

· 政府内部办公

“提升服务水平”

企业

· 行业大模型

· 智能服务调度运营管理平台

· 决策支持与技术创新

“驱动业务创新”

教育

· 科学计算大模型

· 智能教学管理中枢

· 科研加速平台

“广泛应用场景”

大模型释放生产力,让各行业迎来AI惠普时代
标杆案例
用户背景
文件缺乏标准、量多,翻译工具及人工比对,效率低、易出错。
用户方案
利用大语言模型,结合文档自动化处理工具实现对目标文件中技术参数的识别及提取,无缝结合到客户业务流程。
用户价值

实现对全球客户多语言订单准确处理,准确度达到90%。

实现订单分析处理自动化,处理过程从人均耗时20分/单,降低到10秒/单,有效提升订单相应速度。

实现了AI自动化L3级别:在用户定义的任务下,能够自主完成复杂任务,具备较强的推理能力和记忆能力。

智算中心运维服务专注于国内算力中心的日常运行维护,提供基础设施全生命周期管理、智能运维与自动化响应、行业化定制托管运维等全方位、专业化的服务。

基础设施全生命周期管理

涵盖设备监测与管理、故障排查与修复、性能优化与调优、安全防护与加固等全方位、专业化的服务。

硬件层

实时监控GPU集群的算力利用率、显存占用、温度及液冷系统的流量/露点参数,支持千卡级集群动态负载均衡。

定期执行硬件健康巡检(如GPU老化检测、液冷管道密封性测试),更换故障部件并记录数据。

网络层

监控RDMA高速网络的拥塞状态,动态优化分布式存储的IOPS/QoS,保障千卡集群通信效率。

软件层

管理 DeepSeek、MindSpore框架的版本迭代,提供训练任务日志分析与异常定位(如梯度爆炸、内存溢出)。

支持模型版本回溯与多版本并行部署,确保业务连续性。

智能运维与自动化响应
AI预测系统
· 基于历史故障数据训练预测模型(如LSTM+决策树),提前72小时预警GPU老化、液冷管道泄漏等问题,准确率达92%。
能效优化

· 动态调整集群功耗模式,结合分时电价策略降低成本。

自动化响应机制

· 任务迁移:当检测到节点故障时,自动将任务迁移至备用节点,平均恢复时间<15分钟。

· 日志分析:通过NLP技术解析训练日志,自动关联异常事件并定位根因,效率提升80%。

行业化定制服务

提供DICOM数据安全审计(符合HIPAA标准)

支持3D重建模型训练中断自动恢复(断点续传技术)。

提供隐私计算模块,保障智慧城市数据分析安全。

7x24小时应急响应,实时分析零中断。

弹性算力调度:突发算力需求可在5分钟内扩容500PFlops算力。

数据归档:采用冷热存储分级管理,将实验数据存储成本降低60%。

服务保障

软件工程师+AI算法工程师+硬件专家,提供模型调优与硬件故障快速修复。

输出集群性能瓶颈分析(如网络带宽不足、存储IOPS短板)及优化建议。

同步更新硬件固件、框架版本及安全补丁,确保技术领先性。