2023年12月,国家发展改革委、国家数据局等部门联合印发《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,提出到2025年底普惠易用、绿色安全的综合算力基础设施体系初步成型,东西部算力协同调度机制逐步完善,通用算力、智能算力、超级算力等多元算力加速集聚。“构建全国一体化算力网络”、“加快智算中心建设”等政策纳入新基建战略,政策红利为算力产业注入强劲动能。 进入2025年,随着DeepSeek等新科技技术的持续发展,基于DeepSeek训练推理一体机等智能计算服务器开始大量投放市场。作为提供这种计算能力核心设施的智算中心,正逐渐成为业界关注的焦点,并被视为行业发展的重点建设项目。 此背景下,东久科技以20余年的IT基础底座建设经验,为政府及企事业单位提供以智算中心建设实施服务、AI算力一体机销售和智算中心运维服务为核心的全栈业务。
智算中心建设实施服务
AI算力一体机销售
智算中心建设实施服务
智算中心运维服务专注于国内算力中心的日常运行维护,提供基础设施全生命周期管理、智能运维与自动化响应、行业化定制托管运维等全方位、专业化的服务。
· 收集和整理训练数据,对数据进行标注和预处理。
· 对训练过程进行监控和调整,优化模型参数,提高模型的准确性和泛化能力。
· 按客户需求,设计和开发智能应用程序,如智能客服、智能推荐系统、智能安防系统等。
· 将训练好的AI模型集成到智能应用中,实现智能应用的功能。
用户背景
用户方案
用户价值
通过机器视觉与数据分析技术,实现生产过程实时缺陷检测,不良品率从0.8%降至0.1%,年节省质检成本超100万元。
敏感数据100%私有化留存,满足金融/政务级安全要求。
分析设备运行数据预测故障概率,提前安排维护,减少停机时间30%以上。
支持多模态感知与自主决策,实现高危场景风险识别准确率达98%,事故率下降60%。
AI算力一体机销售专注提供浪潮、华为、H3C、安擎等国内优秀厂商的DeepSeek训推一体机产品。AI算力一体机凭借先进的技术架构和强大的性能,能够满足各类复杂的人工智能训练与推理需求,为医疗机构、科研机构、企业及政务领域等用户提供高效、稳定的计算支持,助力其在人工智能领域取得更优异的成果。
东久科技深耕IT基础设施建设领域二十余年,始终以客户需求为核心,构建了覆盖全场景的数字化服务能力。早期依托IBM等国际顶尖厂商的服务器、存储、网络设备及基础软件技术优势,累计为制造、能源、政府等20000余家客户提供标准化产品与场景化解决方案,在超大规模数据中心建设、混合云架构部署等领域积淀了丰富经验。
随着人工智能技术浪潮的推进,东久科技率先完成国产化转型布局,现已成为浪潮信息、华为昇腾、新华三(H3C)、安擎等头部AI服务器厂商的精英级合作伙伴。公司依托二十年行业洞察,重点打造面向大模型训练、智能计算中心等前沿场景的AI算力解决方案。
· 医疗影像分析大模型
· 本地化AI诊疗平台
· 专业知识库
“临床智能化”
· 政务信息公开
· 政务民生服务
· 政府内部办公
“提升服务水平”
· 行业大模型
· 智能服务调度运营管理平台
· 决策支持与技术创新
“驱动业务创新”
· 科学计算大模型
· 智能教学管理中枢
· 科研加速平台
“广泛应用场景”
用户背景
用户方案
用户价值
实现对全球客户多语言订单准确处理,准确度达到90%。
实现订单分析处理自动化,处理过程从人均耗时20分/单,降低到10秒/单,有效提升订单相应速度。
实现了AI自动化L3级别:在用户定义的任务下,能够自主完成复杂任务,具备较强的推理能力和记忆能力。
智算中心运维服务专注于国内算力中心的日常运行维护,提供基础设施全生命周期管理、智能运维与自动化响应、行业化定制托管运维等全方位、专业化的服务。
涵盖设备监测与管理、故障排查与修复、性能优化与调优、安全防护与加固等全方位、专业化的服务。
实时监控GPU集群的算力利用率、显存占用、温度及液冷系统的流量/露点参数,支持千卡级集群动态负载均衡。
定期执行硬件健康巡检(如GPU老化检测、液冷管道密封性测试),更换故障部件并记录数据。
监控RDMA高速网络的拥塞状态,动态优化分布式存储的IOPS/QoS,保障千卡集群通信效率。
管理 DeepSeek、MindSpore框架的版本迭代,提供训练任务日志分析与异常定位(如梯度爆炸、内存溢出)。
支持模型版本回溯与多版本并行部署,确保业务连续性。
· 动态调整集群功耗模式,结合分时电价策略降低成本。
· 任务迁移:当检测到节点故障时,自动将任务迁移至备用节点,平均恢复时间<15分钟。
· 日志分析:通过NLP技术解析训练日志,自动关联异常事件并定位根因,效率提升80%。
提供DICOM数据安全审计(符合HIPAA标准)
支持3D重建模型训练中断自动恢复(断点续传技术)。
提供隐私计算模块,保障智慧城市数据分析安全。
7x24小时应急响应,实时分析零中断。
弹性算力调度:突发算力需求可在5分钟内扩容500PFlops算力。
数据归档:采用冷热存储分级管理,将实验数据存储成本降低60%。
软件工程师+AI算法工程师+硬件专家,提供模型调优与硬件故障快速修复。
输出集群性能瓶颈分析(如网络带宽不足、存储IOPS短板)及优化建议。
同步更新硬件固件、框架版本及安全补丁,确保技术领先性。