数据债星尘数据MorningStar正式发布！狙击成最大看点 (星尘数据融资)

3月11日，AI数据技术公司星尘数据（Stardust AI）正式发布MorningStar——一款面向AI的数据闭环产品。MorningStar是目前首个专注数据价值发现的AI数据平台，基于DataOps的理念打造，全面覆盖AI算法从训练到生产全链路中的数据发现、管理、协作、迭代等各个环节。

星尘数据MorningStar正式发布！狙击“数据债”成最大看点

▲MorningStar正式发布

数据技术已经推动了人工智能的三次变革。在大模型时代，各行各业都需要基于自身数据打造超级员工，以提高企业的生产效率。模型和算力可以购买，但数据需要精细化、全流程的管理，才能释放真正的价值。企业需要搭建一个可发现、可管理、可协作、可迭代的数据管道，才能具备获取数据、生产数据、持续迭代数据的能力，促进内部以数据为中心的协作，从而在AI2.0时代中获得核心竞争力。

MorningStar是市面上唯一一个专为AI2.0时代企业打造的数据闭环产品，全面覆盖AI算法从训练到生产全链路中的数据管理、迭代、优化、挖掘等闭环链路，致力于帮助企业建立高效的数据闭环系统，实现数据价值最大化和模型效果最优化，助力打造差异化竞争力壁垒。

一、精准狙击AI“数据债”，MorningStar应运而生

近年来，AI算法经历了多个发展阶段，但都和数据的突破息息相关。2009年，ImageNet项目充分展示了深度神经网络的潜力。该项目不仅证实了深度学习模型处理复杂视觉任务的能力，也凸显了大规模标注数据在训练高效模型中的重要性。2017年，Transformer架构的推出及其在BERT和GPT等模型中的应用，带来了另一次飞跃。这一阶段的关键创新在于能够利用全网数据进行大规模并行训练，显著提升了模型的理解和生成能力。2022年，大语言模型进一步证明了数据策略和数据质量对于模型的重要性。

星尘数据MorningStar正式发布！狙击“数据债”成最大看点

过去，MLOps一直是业界关注的焦点，即如何优化模型的性能。2021年吴恩达提出了Data-centric AI的主张，许多研究人员开始将目光转向以数据为中心的AI研究。其主要目标是加强数据的质量和数量，而不过多关注模型结构的调整。在大模型领域，这种转变尤为显著。例如，相较于GPT2，GPT3在模型结构上的改变微乎其微，更多的精力放在了清洗高质量的大规模训练数据上。同样，ChatGPT与GPT3相比，也没有改变模型结构，而是采用了全新的数据策略与人类意图对齐。

AI的三次变革凸显了数据技术在推动机器学习算法进步方面的关键作用。事实上，算法开发过程中有80%的工作与数据相关。一个算法的上线部署需要经历需求定义、方案制定、数据采集、数据标注、模型设计、训练、指标测试、推理优化等等。在各个环节中，各个角色跨组织协同会导致企业数据债的产生。简单来说，数据债指的是企业当前状态与最大化数据价值之间的差距。数据债包含算法和其他部门的认知差别、项目时间上的认知差别、文档和数据语义的差距、不同数据集定义之间的差距等。数据债不仅会导致数据价值无法释放，运营成本不断增加，还会影响模型的上线和迭代效率。

星尘数据MorningStar正式发布！狙击“数据债”成最大看点

▲机器学习全生命周期数据债

“为了解决机器学习中的数据债问题，MorningStar应运而生。”星尘数据创始人&CEO章磊表示：“MorningStar专注于发现数据价值，加速模型迭代，为AI2.0打造以数据为中心的协作环境，消除数据债。”

MorningStar全面覆盖AI全生命周期的数据闭环，不仅能确保数据的统一管理和快速迭代，还集成了主流难例数据的发现策略，支持AI算法的高效迭代，为企业提供一个全面的数据维护工具，以满足其对数据管理和价值挖掘的需求。

二、重构数据闭环，打通AI数据全生命周期管理

在机器学习中，模型在整个流程中所占比重很少，算法工程师绝大部分时间都是花在思考业务、数据标注和数据分析上，以提高模型的泛化性。算法工程师需要耗费大量的时间和精力仔细研究数据，找出异常之处，了解数据规律，反复编排流程，比较版本差异，以提高模型的泛化性，达到最佳效果。例如：难以直观看到数据分布，效率低；数据语义缺乏记录，难复现；数据指标不完善，难挖掘；数据量巨大，检索困难......据OpenAI内部工程师透露，由于数据历史语义丢失，ChatGPT之前曾一度面临模型无法复现的问题。

针对这些痛点，星尘数据自主研发了AI数据全生命周期管理功能，强化数据版本控制、快捷数据切片、可追溯数据血缘和安全管控。MorningStar集成了八大功能，其自动化工作流能够确保数据在每个阶段都能得到妥善管理和最优化。

星尘数据MorningStar正式发布！狙击“数据债”成最大看点

▲MorningStar数据闭环

●数据可视化：支持多源、多格式、异构的结构化数据统一管理，实现全面而高效的数据收集与存储。

●数据生命周期管理：用户可以通过平台进行数据流程的编排和调度，实现数据的自动化处理和转换，同时记录全生命周期数据信息，确保数据的可追溯性和操作的可复现性。

●数据探索：提供超大规模AI数据管理能力，用户可以利用平台的强大搜索功能，通过多语义、跨模态等方式快速找到所需的数据，并进行可视化分析。

●难例发现：集成主流难例发现策略，如主动学习等，为算法工程师提供数据特征分布、可视化和模型指标计算等便捷功能。

●人类反馈：创建高质量的人类反馈通道，一键送标至自动化标注系统Rosetta。

●数据合成：支持可控数据生成，填补现实世界中的数据空白，提高模型的鲁棒性和适应性。

●算法指标跟踪：支持SDK，打通算法和数据的反馈闭环，可进行算法管理和指标评测，提升模型迭代的效率和可靠性。

●数据连接：推理管理与性能监控，实现模型部署和优化的高效循环。

星尘数据MorningStar正式发布！狙击“数据债”成最大看点

▲ AI数据发现、管理、协作、迭代平台MorningStar

章磊表示：“MorningStar的目标用户主要分为三类：机器学习算法工程师、业务人员、研发负责人。对于不同的用户，我们的平台可以满足各种需求，包括发现数据中的难例，跟踪指标，记录数据全生命周期等等，从而让数据价值最大化，模型更好地迭代。”

三、集合主流难例发现策略，大幅提高算法效果

MorningStar具备丰富的数据挖掘工具，兼容各类难例数据发现策略，助力发现数据的全面价值，包括细颗粒度可视化、指标计算、数据分布探索、跨模态数据检索等。通过人工监督、语义检索、特征生成和数据增强等手段，提高算法效果，助力算法迭代降本增效。

星尘数据MorningStar正式发布！狙击“数据债”成最大看点

▲通过数据分布发现难例

此外，MorningStar具备强大的指标追踪与模型分析能力，能够保障模型训练过程的可追溯性与可迭代性。通过一系列数据追溯、模型调试和分析生成工具，助力实现和维护高质量、可再生产的AI模型。

星尘数据MorningStar正式发布！狙击“数据债”成最大看点

▲MorningStar客户案例

一位自动驾驶算法工程师曾反馈，原本需要花费1天时间才能发现的难例，通过MorningStar平台只需要1-2小时即可，大大提高了迭代效率。

四、解锁数据潜力，实现数据价值的最大化

现阶段，算力和基座模型都可以直接购买，公域数据逐渐成为标品的情况下，私域数据成为了企业最核心的竞争力。然而，数据量并不等于数据质量，企业只有自身具备沉淀私域高质量数据的能力、即可直接用于生成超级员工的数据，才能获得市场竞争的核心优势。从这个角度上看，具有数据价值发现的数据管理平台，成为了AI2.0时代的必然趋势和全新挑战。

MorningStar致力于帮助企业建立可发现、可管理、可协作、可迭代的数据管道，将助力企业在未来竞争激烈的市场中占据领先地位。

星尘数据MorningStar正式发布！狙击“数据债”成最大看点

数据价值可发现

MorningStar能够帮助企业将海量非结构化数据转为数据洞察，帮助企业作出更明智的决策，优化业务流程，提高效率和竞争力。

数据要素可管理

MorningStar支持对数据集进行全面分析，助力企业和团队负责人实现企业级数据要素管理分析，一览呈现数据资产规模、内容分布、归属权等维度的信息。

数据应用可协作

MorningStar提供了协作和共享功能，支持数据权限管理，使团队协作更安全。企业可以创建多个用户账号，控制数据访问权限，并支持实时协作编辑数据。

数据资产可迭代

MorningStar支持数据版本控制和追溯，帮助企业跟踪数据的使用过程。通过不断地迭代和改进数据资产，保持数据的活力和价值，适应不断变化的业务环境。

星尘数据MorningStar正式发布！狙击“数据债”成最大看点

章磊介绍说：“在AI2.0时代，掌握自己的数据就是掌握自己的模型。”企业数据价值的核心在于定义、管理和迭代数据。通过可发现、可管理、可协作、可迭代的数据管道，企业的生产力可实现10倍以上的提升。

随着大模型的普及，AI已经迅速渗透到各行各业，企业拥有的数据是核心竞争优势。MorningStar不仅能够支持企业高效迭代AI数据的关键环节，避免数据债风险的积累，还能减少低价值数据成本的浪费，解决模型训练和应用效果反馈链条过长等问题。作为AI数据服务的先行者，星尘数据不仅将用MorningStar助力AI2.0发展，还将持续以数据为中心，推出新的功能和服务，以满足用户不断变化的需求，发现数据价值，加速AI创新。

版权文章，未经授权禁止转载。详情见转载须知。

星尘数据MorningStar正式发布！狙击“数据债”成最大看点

谷普下载提醒您

本文链接：http://www.gpxz.com/article/046f17c82537095861fe.html

上一篇：出任曹操出行董事长退出出行易到创始人周航

下一篇：特斯拉人形机器人上海人工智能大会的华为盘

百度页游中心

百度页游中心，为玩家提供优质的精品网络游戏，致力于提供优质的用户服务，成为深受玩家喜爱的游戏平台

游戏网游 2025-03-03 17:12:18

美甲小游戏,美甲小游戏大全,4399美甲小游戏全集,4399小游戏

4399美甲小游戏大全收录了国内外美甲小游戏、美甲店小游戏、做美甲小游戏、阿sue美甲小游戏、美甲小游戏下载、最新美甲小游戏。好玩就拉朋友们一起来玩吧！

游戏网游 2024-08-16 23:08:43

深圳市警威智能设备有限公司

深圳市警威智能设备有限公司成立于2016年，公司总部位于深圳特区华强创意产业园。是一家技术领先、专业从事智能警用设备及智能执法信息化整体解决方案的科技企业，集研发、制造、销售、服务于一体。

商业服务 2024-07-18 22:46:46

6G游戏网

6g游戏网是一个手机游戏综合门户型网站，提供包括iPhone游戏、iPad游戏、安卓游戏等手机游戏免费下载，和丰富的手机游戏攻略、汉化、评测等原创内容，致力于带给每位手机玩家们源源不断的游戏正能量。

游戏网游 2024-07-11 13:34:43

新律政职业培训学校

学校大学 2024-07-08 18:51:00

深圳之窗

深圳之窗为您提供本地最新资讯，内容覆盖深圳便民服务查询，深圳旅游、美食、亲子教育、房产、商场打折促销等信息。

新闻资讯 2024-11-13 13:52:43

云计算服务由世纪互联运营

有目的地发明，节约成本，让你的组织能够更高效地利用MicrosoftAzure灵活的开放式云计算平台。

互联资讯 2024-11-17 15:26:21

北京艾迪润色

行业信息 2024-11-18 19:46:22

快快网络

快快网络作为新一代云安全引领者，为全球客户提供DDOS防护，CC防护，WAF安全，BGP高防服务器等专业智能服务，为政企等各行业提供云安全解决方案。

网络应用 2024-11-20 16:45:37

南京天溯自动化控制系统有限公司

电影视频 2025-01-28 21:20:09

热门手机游戏下载

6822游戏网为用户搜罗全网手机游戏，每日更新发布最新手游，同时提供免费、绿色、必备手机软件，时下热门手游、软件下载量排行一目了然，玩更多精彩好游戏，就来收藏6822游戏网。

游戏网游 2025-02-01 13:43:11

茂名招聘网

茂名招聘网,茂名人才网提供茂名人才招聘网求职信息及茂名人才网招聘信息.为茂名人才网络求职,招聘,提供贴心服务.茂名招聘网是茂名市诚信人力资源服务机构.茂名求职网络招聘,就上茂名招聘网

网络应用 2025-02-11 21:57:01

蓝瘦香菇是什么?照片曝光视频背后真相竟是这 (蓝瘦香菇是什么意思)

最近，，蓝瘦香菇，一词微博朋友圈爆红，连商标都被深圳一家公司抢注了，不少网友好奇，视频中操着爆笑口音的小伙，到底是谁?日前，蓝瘦香菇哥本尊终于现身，并开通了微博，认证资料为，蓝瘦香菇，视频当事人，短短连天，其微博粉丝已经超过28万，有媒体对蓝瘦香菇哥进行了电话采访，终于得知这段爆火视频的真相，原来，小哥却并没有失恋，而是老婆外出旅游才...。

2025-01-30 17:37:42

互联网企业第一阿里巴巴研发投入位居中国民营企业第二 (互联网企业第一)

中华全国工商业联合会近日发布，2021民营企业研发投入500家，榜单，榜单显示，华为位居榜首，阿里巴巴位居第二，超过腾讯、百度，在中国互联网企业里位居第一，研发投入是衡量企业创新力的关键标准，过去十年，中国互联网企业对前沿科技的投入不断增加，以阿里为例，2009年，其研发中国唯一云操作系统飞天，开启中国云时代；2017年，阿里巴巴成立...。

2024-12-10 00:14:26

我们问了他13个问题深访迅雷CEO陈磊 (我们问了他的几位邻居那时他们在做什么英语)

作为一家2003年创立的公司，迅雷一直以，中国最好的下载工具，而被广大网友所熟知，但就在大概3个月前，迅雷开始了一场轰轰烈烈的复兴，股价从2.9美元直升18美元，股价最大波动涨幅达到800%，巨大波动背后的原因也很简单，迅雷将其互联网CDN等云计算技术，与区块链技术结合，推出了全新的，玩客云，以及对应的数字资产，链克，原玩客币，一...。

2024-12-09 23:56:16

0429是哪里的区号 (0429是哪个城市的区号)

0429是辽宁省葫芦岛市龙港区的区号葫芦岛市龙港区，位于中国辽宁省南部，是葫芦岛市下辖的一个区，地处辽东湾西岸，葫芦岛市东部，地理位置优越，是东北地区的重要出海口岸，龙港区总面积约724平方公里，人口约50万，是一个融合了山海资源与现代工业的区域，龙港区历史悠久，文化底蕴深厚，拥有丰富的旅游资源，如葫芦岛海滨国家森林公园、龙回头景区等...。

2024-12-06 15:31:22

中国依赖症三星占领印度高端手机半壁江山么苹果真有 (中国人的依赖性)

近些年，中国手机厂商开始跟随小米进入印度市场，在中低端手机领域逐步获得了一些份额和优势，不过在印度市场，高中低端全线通吃的韩国三星电子，仍然占据着绝对老大的地位，以高端机市场为例，据印度时报网站报道，三星电子印度公司的相关负责人ManuSharma表示，根据市场研究公司GfK的数据，在价格超过三万印度卢比，相当于450美元、2900元...。

2024-12-03 20:44:23

腾讯云助力民生保险投产业内首个云原生寿险核心业务系统 (腾讯云助理)

5月11日，记者获悉，民生保险新一代寿险核心业务系统日前正式投产上线，该系统是行业内首个完全基于云原生架构设计打造的寿险核心业务系统，部署在由民生保险与腾讯云联合打造的私有企业云上，目前系统已经平稳运行数日，覆盖民生保险开业至今过千万的保单和客户的所有业务数据，历时三年，打造业界首个云原生险核心业务系统据了解，民生保险新一代寿险业务系...。

2024-11-30 20:02:29

套路层出不穷的年代如何防被割韭菜 (套路层出不穷啥意思)

17世纪的荷兰，郁金香作为观赏用品受到荷兰人狂热的追求，这让投机者看到商机，他们开始囤郁金香，使得郁金香的价格水涨船高，价格远远超过了实际价值，因为倒买倒卖所获取的暴利令人垂涎，当时几乎所有的荷兰人都疯狂囤积郁金香，在短短一个月内，郁金香的价格涨幅便超过了29倍，其中许多人是变卖家产加入到这个疯狂的市场，但是当越来越多人怀疑郁金香价格...。

2024-11-21 22:38:35

10 阅读器 PDF 个收费 [2024版] 适用于电脑用户的 (阅读器阅读)

在数字化时代，PDF文档的解决与阅读成为无法或缺的一局部，以下是一些专为电脑用户精心筛选的收费PDF阅读器，各具特征，满足不同需求，1.SumatraReader轻捷的SumatraReader专为Windows设计，特意是Windows10，8，7用户，它的USB可携带性使其在任何设施上都能流利运转，界面繁复，易于上手，好处包含多言...。

2024-07-13 21:17:49

售价3万的电动汽车 EV静态体验五菱宏光MIN (3万左右的电车排行榜)

最近，各大社交媒体平台都能看到五菱宏光MINI?EV的身影，甚至还有好友计划开它去西藏自驾游，这辆3万元左右续航100多公里的小车更是在9月份开售了辆，力压势头正劲的特斯拉Model?3，所以咱们也买了一辆，2020款悦享款，官网指点价3.88万，外观设计见仁见智这辆小车的外观真的只能用，见仁见智，来描画，看起来小巧可恶，还有点儿日本...。

2024-07-07 15:49:11

江淮和悦新车多少钱 (江淮和悦新车多少钱一辆)

江淮和悦售价是658万888万1全新和悦在外观外型内饰结构和兽性化设计上都有较大的改良，自始自终，超大空间和很好的能源性能也是两大亮点2在性能上，全新和悦同价位的自主品牌车型更高，这也增强了和越在；依据您形容的年限和里程，联合如今新款车型4S店活动后实践裸车成交价和保值率以及排放规范关于二手车多少钱的影响，假设没有意外，外观划一，内饰...。

2024-07-07 05:21:04

哪位大虾知道可以收看到国外电视直播的软件例如BBC.星空电视之类的 (哪位大虾知道大虾死了)

如同很多网络电视都可以哦，比如，流星网络电视，等等你好，我想在本国的直播软件上做直播，可以跟本国人交换，请问有什么如今人都是用手机看直播啊，不要说直播了就连游戏都是越来越多人玩手游了，躺在床上玩手游戏，看直播多繁难，悟空tv外面就很多直播手游的，像王者荣耀，天天酷跑，节拍巨匠，泡泡大战等等有没有国外能用的体育直播软件，可以上网络的直播...。

2024-07-05 16:03:47

疯狂12小时，7大压哨转会！英超4豪门官宣，巴萨2进1出：10号离队|曼城|曼联|利物浦|切尔西队|巴塞罗那队

疯狂12小时，7大压哨转会！英超4豪门官宣，巴萨2进1出：10号离队,英超,疯狂,曼城,曼联,巴萨,利物浦,切尔西队,巴塞罗那队

2023-09-02 16:49:26

文章推荐

李彦宏和百度20年落单史

2020年，20岁的百度，52岁的李彦宏，以，搜索称王，制霸华尔街的高光时刻不在，但互联网圈还留有，百度这些年跨界布局，的记忆，电商、视频、游戏、招聘、团购、020、外卖、内容、直播……百度一路都在紧追慢赶，轮换的风口，，但始终没有跳出，迟了、迟了、又迟了，的怪圈，惨败的项目、频换的高管、乏力的增速、暴跌的市值……残酷的事实在不加掩饰...。

2025-01-30 23:40:58

网络百科

转发了今天腾讯老总马化腾的生日 (已经转发了)

今天是马化腾的生日，转发这条消息到五个群，他们会骂你是XX，管理还可能会禁言你，但是他们百度过后就会发现，今天真的是马化腾的生日....马化腾，腾讯公司控股董事会主席兼首席执行官，别名小马哥，外文名Pony，百科资料显示，马化腾1971年10月29日生于广东省汕头市潮南区，腾讯公司主要创办人之一，在创办腾讯之前，马化腾曾在中国电信服务...。

2025-01-30 22:41:42

网络百科

开启聊天式客服革命 Facebook将发布聊天机器人API (开启聊天模式是什么意思)

据外媒报道，Facebook正为开发者提供API工具来开发面向企业客户的聊天机器人和LiveChat实时聊天Web插件，众所周知，聊天机器人能够充当出色的助手，它能够帮助企业建立自动化的响应系统，以便回复来自潜在客户的信息，不过，鉴于大多数企业客户都不具备自主开发聊天机器人的资源和技术，所以Facebook决定在Messenger上提...。

2024-12-03 17:30:28

资讯动态

但做好产品是第一位对话一加李杰成本上升 (做出好的产品)

这次我们比上一代产品提前了5、6周的时间发布，从12月份提到了10月底，目前为止一加13在体验上是历年来旗舰最高的水准，一加中国区总裁李杰对说到，10月的最后一天，一加13正式发布，作为一加品牌新旗舰之作，其在性能、屏幕、影像、续航等方面都进行了全面升级，展现出，样样超Pro，的实力，对一加来说，无论是产品还是这一年，都有着非...。

2024-12-03 15:38:38

资讯动态

让你的业绩翻倍传统生意以及门店如何做引流 (让你的业绩翻译成英语)

传统生意难做，线下门店难做，各种支出，各种成本，各种不确定性，各种政策也在变，所以要想让营业额良性增长，可持续赚钱就要做好私域以及门店的引流获客和用户运营，触达模型是面向私域用户，能不断接触用户的点，比如，私信，朋友圈，公众号推送，公众号菜单栏，群公告等，正常微信私域用户池是公众号，个人微信号，微信群，朋友圈的结合，我们要把这些能够触...。

2024-11-26 17:39:53

网络百科

数据债 星尘数据MorningStar正式发布！狙击 成最大看点 (星尘数据 融资)

相关文章

文章推荐

数据债星尘数据MorningStar正式发布！狙击成最大看点 (星尘数据融资)