Login

020-123-1374leyusports@szegm.cn

  1. 乐鱼 > 新闻动态 > 行业资讯

乐鱼官方平台过年8天AI圈变天!56件生成式AI要闻一文看尽OpenAI谷歌英伟达齐放大招

作者:小编 日期:2024-02-19 20:44:01 点击数:

  乐鱼官方平台过年8天AI圈变天!56件生成式AI要闻一文看尽OpenAI谷歌英伟达齐放大招如英伟达、谷歌、微软、亚马逊、苹果、Meta、Adobe等公司,都在春节期间放出了生成式AI大招。

  英伟达于2月15日登上新巅峰,市值1.83万亿美元成美股第三仅次于苹果和微软。在此期间,英伟达首次公开Eos超级计算机,发布AI聊天机器人Chat with RTX,并传出组建芯片定制新部门。

  谷歌发布了其大模型矩阵的最新力作Gemini 1.5;微软被曝出投资32亿欧元建设德国AI基础设施;亚马逊推出了10亿参数文本转语音模型;苹果被曝将推出类似于微软GitHub Copilot的AI编程工具;Meta发布世界模型早期版本V-JEPA……

  美国AI创企Cohere推出覆盖101种语言开源大模型Aya;Stability AI推出了消费级硬件可训的文生图模型。基础设施创企Meter融资3500万美元,生成式AI创企Rasa融资3000万美元,GPU云服务商Lambda融资3.2亿美元;此外,AI数据提供商Scale AI、AI搜索引擎创企Perplexity AI、医疗AI创企Abridge等多家AI创企已经或马上获得融资。

  在国内,处于春节假期的产业玩家进展披露不多,但我国史上AI含量最高的央视总台春晚(《十年最好看春晚,史上AI含量最高!芯片硬核霸屏,机器臂转手绢,无人机秀阵法》)火速出圈;在国外,美国FTC提出新措施打击生成式AI伪造欺诈行为,欧盟通过AI临时协议并宣布于4月推《AI法案》,都让2024龙年春节假期成为生成式AI的重要时刻。

  智东西2月10日消息,据路透社今日报道,知情人士透露,英伟达正在建立一个新的业务部门,专注于为微软、Meta、谷歌等云计算公司以及爱立信、任天堂等其他公司设计包括AI芯片在内的定制芯片。

  据社交平台Threads网友Mishaal Rahman发文,谷歌于2月10日更新了安卓版Gemini,支持用户通过上划手势或长按电源键唤醒Gemini并自动发送查询。此前,用户只能通过“Hey Google”来调用Gemini。

  据The Verge报道,微软可能正在为PC游戏开发类似英伟达DLSS的AI自动超级分辨率功能。社交平台X的一位用户2月10日发文分享了其在Windows 11最新测试版本系统中发现的这一功能。该功能被描述为“利用AI让游戏在细节增强的同时运行更流畅”,听起来类似英伟达的DLSS、AMD的FSR以及英特尔的XeSS。微软还没有正式官宣这一新功能。

  据微信公众号全民熊猫计划2月11日发文,创作者海辛Hyacinth和Simon阿文复盘了其制作的首个登上央视春晚的AI视频项目。该项目使用了开源社区中最新的技术ControlNet、AnimateDiff、LCM、IPAdapter,将一段真人双人舞用AI的风格转绘成陶瓷的舞蹈。

  据英国《金融时报》2月12日报道,今年截至发文日共有138家科技公司裁员,波及3.4万人。分析人士称,最新的裁员潮表明企业正在重新调整资源,以便投资于生成式AI等新领域,同时也向股东表明,企业仍在继续关注成本纪律。

  2月12日,美国AI创企Stability AI推出了一个文生图模型Stable Cascade预览版。Stable Cascade基于大规模文本到图像扩散模型的高效架构Wrstchen,易于在消费级硬件上训练和微调。为了让大家能够更方便地使用和定制这一模型,Stability AI还发布了相应的训练和推理代码,这些代码可以在GitHub页面上找到。

  根据arxiv网站,亚马逊团队于2月12日推出一个名为BASE TTS的文本转语音(TTS)模型,它代表了大规模自适应流式TTS的崭新涌现能力。作为迄今为止最大的TTS模型,BASE TTS在10万小时的公共语音数据上进行了训练,从而提高语音自然度。其工作原理是通过一个拥有10亿参数的自回归转换器,将原始文本转化为离散代码(语音代码);接着,一个基于卷积的以增量的、流式的方式将这些语音代码转化为波形。值得一提的是,模型的语音编码采用了新颖的语音标记化技术,该技术具有说话人ID解纠缠和字节对编码压缩的特点。团队发现,使用10K+小时和500M+参数构建的BASE TTS变体开始在处理复杂文本句子时展现出自然韵律。

  据路透社报道,谷歌2月12日宣布承诺投入2500万欧元(约合人民币1.93亿元)帮助欧洲人学习使用AI,这笔款项已向社会企业和非营利组织开放申请,谷歌还将运营一系列“成长学院(growth academies)” ,帮助AI公司扩大经营规模。上个月,谷歌刚刚宣布将投资10亿美元在英国伦敦建立一个数据中心,以满足该地区日益增长的互联网服务需求。

  据《纽约时报》报道,巴基斯坦前总理伊姆兰汗(Imran Khan)近几个月来,一直在狱中使用AI复制自己声音的演讲来拉拢支持者。尽管在竞选期间,官员阻止他的候选人参加竞选活动,并审查对该党的新闻报道,但据当地时间周六的官方统计信息显示,与他的政党巴基斯坦自由党(Pakistan Tehreek-e-Insaf,P.T.I.)结盟的候选人赢得了最多席位。

  据彭博社报道,英伟达CEO黄仁勋在当地时间2月12日于迪拜举行的世界政府峰会上表示,预计未来几年计算机技术的进步将使AI的开发成本远低于OpenAI CEO萨姆阿尔特曼(Sam Altman)所要筹集的7万亿美元。黄仁勋说:“你不能只考虑买更多计算机,因为计算机的性能也在增强,所需总量不会有那么多。”

  黄仁勋认为芯片行业技术进步将降低AI开发的成本,但同时他也在讲话中提到未来五年,全球范围内的AI数据中心建设投入将翻一倍,达到2万亿美元。

  由OpenAI董事会主席布雷特泰勒(Bret Taylor)创办的AI创企Sierra,2月13日正式在其官网推出面向企业的对话式AI平台Sierra,旨在让每家公司都能够构建自己的AI代理。Sierra代理可以使用自然语言和复杂的推理来创建真实、令人满意且符合品牌调性的对话互动。目前,已经有至少4家企业通过Sierra构建自己的AI代理。

  英伟达2月13日发布AI聊天机器人Chat with RTX,可让用户个性化连接到自己GPT大语言模型 (LLM),支持文档、笔记、视频或其他数据等不同形式的内容输入。只需将应用程序指向包含文件的文件夹,它就会在几秒钟内将它们加载到库中。用户可以提供YouTube播放列表的网址,应用程序可以将加载播放列表中视频转录,让用户可以查询其涵盖的内容。

  美国AI创企Cohere 2月13日推出新生成性大语言研究模型 (LLM),涵盖101种不同的语言,是现有开源模型涵盖的语言数量的两倍多。开源Aya模型以及迄今为止最大的多语言指令微调数据集,其规模为5.13亿,涵盖114种语言。该数据收集包括来自世界各地的母语人士和流利使用者的注释。

  据路透社报道,欧洲议会的两个关键立法者小组2月13准了一项关于AI规则的临时协议,之后将拟定《AI法案》,于4月份的立议上进行投票,这将为世界上第一个关于AI的立法。该法案旨在为广泛行业使用的技术安全护栏,涉及范围从银行到汽车以及电子产品和航空公司等。

  微软2月13日在其官网宣布推出Microsoft Fabric、ESG 价值链解决方案、Microsoft Sustainability Manager等新的AI解决方。这些方案可以帮助企业借助AI能力更好做出决策。比如说,用户可通过生成式AI和自然语言查询来更快地了解数据并从数据中获得分析结果。

  截至2月13日美股收盘时间,英伟达股价下跌2.15%,股价下跌0.17%,市值达到1.78万亿美元,超过亚马逊1.75万亿美元的市值。接下来,英伟达的市值即将超越Alphabet,有望成为全球第三大公司。

  2、ChatGPT记忆管理功能本周上线日在其官网宣布,他们正在测试ChatGPT的记忆管理功能。该功能可以记住用户在所有聊天中所讨论的内容,也可以让用户不必重复输入信息,并对以后的对话更有帮助。本周OpenAI将向一小部分ChatGPT免费版和Plus用户推出记忆管理功能。

  据The Information报道,OpenAI创始成员之一安德烈卡帕蒂(Andrej Karpathy)已离开公司。离职后,他正在开发一款AI助手产品,并与OpenAI研究主管鲍勃麦格鲁(Bob McGrew)密切合作。“安德烈将离开去追求个人项目。我们对他的贡献深表感谢,并祝他一切顺利。”OpenAI发言人Kayla Wood在一份声明中表示。“他的职责已转变为与安德烈密切合作的高级研究员。”

  据The Information报道,近日首批Gemini AI用户反馈Gemini Ultra的使用体验与GPT-4大致相当。Gemini Ultra所支撑的Gemini聊天机器人比GPT-4所支持的ChatGPT Plus的回答速度更快、回答内容更简洁、回答语句也更客观。此外,Gemini创意讲故事能力也令其中一些用户感到惊讶。

  据彭博社报道,OpenAI董事会主席布雷特泰勒(Bret Taylor)在宣布成立AI创企Sierra一天后,驳斥了他的新公司可能与OpenAI产生竞争的担忧。泰勒在接受采访时表示:“我真的不认为OpenAI和Sierra具有竞争……我们存在于堆栈的不同层。我们是OpenAI的客户,此外还有其他一些基础模型。”

  互联网基础设施的初创公司Meter 2月14日表示,已在OpenAI CEO萨姆阿尔特曼(Sam Altman)和Stripe早期员工兼著名投资者Lachy Groom领投的新一轮融资中筹集了3500万美元。该轮融资计划投资产品、供应链并发展团队。

  美国专利商标局(USPTO)2月14日在其官网发布了最新指南。它指出,AI系统不能被命名为发明人,但人可以在创造专利发明的过程中使用AI工具。使用AI的人必须对发明的构思做出重大贡献。一个人如果只是要求AI系统创造一些东西并监督它,则不能成为专利申请者。

  根据Slack官网,美国SaaS龙头Salesforce子公司Slack于2月14日推出了Slack AI服务,能力包括:搜索答案,提供个性化的、智能的问题回答服务;从可访问的通道生成关键亮点回顾;一键从大量对话中获得议程总结。围绕Slack AI的一项内测分析发现,优步(Uber)和Anthropic等客户使用Slack AI来寻找答案、提炼知识和激发创意,平均每周可以为每位用户节省约97分钟时间。Slack公司CEO丹尼斯德雷瑟(Denise Dresser)说:“在生成式AI时代,Slack是一个值得信赖的对话平台,它将企业的每个部分联系起来,从而提高团队的生产力。”

  据路透社报道,诺基亚2月14日推出了一款AI助手,名为“MX Workmate”,该助手可以为产业工人提供信息,包括基于实时数据的故障机器警告和提高工厂产量的建议方法。

  据彭博社报道,近日设计软件巨头Adobe推出新的AI Artbot,并且表明其解决方案将提供版权保护。Adobe首席营收官斯蒂芬弗里德 (Stephen Frieder)表示,它正在与酒店、媒体和零售领域的数十公司进行试验,并指出品牌公司现在可以合法地改变照片背景,而无需重新拍摄。

  OpenAI CEO萨姆阿尔特曼(Sam Altman)2月14日在迪拜举行的世界政府峰会(WGS)上通过视频电话表示AI的发展速度可能远快于世界的预期,他呼吁建立一个像国际原子能机构(IAEA)这样的机构来监督AI的发展。

  2月15日晚间,谷歌发布其大模型矩阵的最新力作Gemini 1.5。谷歌发布的第一个用于早期测试的Gemini 1.5模型是Gemini 1.5 Pro,这是一个中型的多模态模型乐鱼体育,针对广泛任务进行了优化,其性能与谷歌迄今最大的模型1.0 Ultra相当,同时使用了更少的计算。该模型在长语境理解方面取得突破,能显著增加模型可处理的信息量——持续运行多达100万个tokens,实现迄今任何大型基础模型中最长的上下文窗口。这意味着Gemini 1.5 Pro可一次处理大量的信息——包括1小时的视频、11小时的音频、超过3万行代码或超过70万字的代码库。

  截至美股2月14日收盘,英伟达股价上涨2.46%,市值达到1.83万亿美元(约合13.2万亿元人民币),超过谷歌母公司Alphabet的1.82万亿美元,成为美股第三大公司,仅次于苹果和微软。

  据Business Insider 2月15日报道,泄露文件显示,谷歌悄悄推出了名为“Goose”的内部AI大语言模型,以帮助员工更快地编写代码,协助开发新产品,提高工作效率。Goose“在谷歌拥有25年的工程专业知识”,仅供谷歌员工使用,“可以回答有关谷歌特定技术的问题,使用内部技术栈编写代码,并支持基于自然语言提示编辑代码等新颖功能”。一份内部文件指出,Goose是“将AI带入产品开发过程的每个阶段”计划的一部分。目前还不清楚它是否功能齐全。Goose“还计划成为谷歌批准的第一个用于内部变成的通用大语言模型”。

  英伟达2月15日发布了一段视频,首次向公众展示了其最新的数据中心级超级计算机Eos。Eos在全球超级计算机500强中排名第9,是一款极大规模的英伟达DGX SuperPOD,开发人员可以在Eos上使用加速计算基础设施和完全优化的软件来实现AI突破。Eos超算采用576个英伟达DGX H100系统、英伟达Quantum-2 InfiniBand网络和软件构建,共有4608个H100 GPU,可提供总计18.4EFLOPS的FP8 AI性能。

  据The Information 2月15日报道,OpenAI CEO Sam Altman私下称其引起轰动的7万亿美元芯片筹资数额代表的是此类企业参与者在一段时间内需要进行的投资总额,包括从房地产、数据中心电力到芯片制造等等。

  据外媒The Information报道,据了解OpenAI计划的人士透露,OpenAI一直在开发一款网络搜索产品,这将使其与谷歌展开更直接的竞争。这位人士说,搜索服务将部分由必应(Bing)提供。

  据彭博社2月15日报道,微软总裁Brad Smith在一场活动中宣布计划未来两年向德国AI基础设施投资32亿欧元。这笔资金是微软在德国最大的直接投资。

  据彭博社2月15日报道,谷歌为其AI研究团队在法国巴黎开设了一个新的研究中心。新设施将容纳总共300名科学家和工程师,他们此前分散在巴黎的其他谷歌办公室。Alphabet及谷歌CEO Sundar Pichai周四与法国总统马克龙见面讨论了计划今年举行的法国AI峰会筹备工作等主题。

  据外媒NHK报道,日本电信巨头软银正在与美国芯片制造商英伟达结成联盟,利用AI来改善无线服务,目的是开发可以在手机发射塔处理数据而无需依赖数据中心的技术。该组织将被称为AI-RAN联盟,成员包括主要移动传输设备供应商瑞典爱立信和芬兰诺基亚。消息人士称,数据处理的去中心化将允许在手机上提供更高级别的AI服务,该技术还将实现基站网络操作的自动化,允许基站自动适应数据量的变化并帮助网络避免延迟。

  2月16日凌晨,OpenAI推出其首款文生视频大模型Sora。该模型能根据提示词生成长达1分钟的视频,或者扩展生成的视频使其更长,同时视觉质量相当惊艳。Sora不仅对文本理解更深刻,能准确地呈现提示词,而且可在一个生成的视频中创建多个镜头,准确地保留角色和视觉风格。除了支持文本指令输入外,该模型支持生成图像,也支持将现有静止图像变成视频,能对现有视频进行扩展、将两个视频衔接并填充缺失的帧。其3D仿真能力非常突出,无论是制作短视频、动画、电影画面,还是渲染视频游戏,都展示出了令人期待的落地前景。

  Meta 2月16日推出V-JEPA模型,一种通过观看视频来教机器理解和模拟物理世界的方法,以迈向利用对世界的学习理解来计划、推理和完成复杂任务的AI愿景。Meta发布了一组V-JEPA视觉模型,这些模型使用自监督学习进行了特征预测目标的训练,能够在信息有限的情况下理解和预测视频中发生的事情。它通过在其内部特征空间中预测视频中缺失或模糊的部分来学习。与填充缺失像素的生成方法不同,这种灵活的方法可以使训练和样本效率提高6倍。结果表明,其V-JEPA模型在kinect-400上成绩达到82.0%,在Something-Something-v2上达到72.2%,在ImageNet1K上达到77.9%,比肩或超过此前的领先视频模型。

  据彭博社2月16日报道,苹果正加紧开发更多AI功能,其为App开发者开发的一款关键软件工具即将完成,作为苹果旗舰编程软件Xcode下一个主要版本的一部分,计划最早于今年向第三方软件制造商发布。据悉,新系统的操作方式将类似于微软GitHub Copilot,使用AI来预测和完成代码块。苹果也在探索使用AI来生成测试应用程序的代码。

  此外,苹果探索了自动创建Apple Music播放列表、Keynote制作幻灯片等AI功能,还考虑在其全系统搜索功能Spotlight的新版本引入大语言模型来回答复杂问题。苹果正持续磨练其大语言模型,以增强Siri和AppleCare支持等服务,并在将AI整合到其健康功能上投入了大量资金。

  据TechCrunch 2月16日报道,美国专利商标局拒绝了OpenAI申请“GPT”商标的尝试,裁定该术语“仅具有描述性”,不符合注册商标的标准,也不符合名称后加“TM”所提供的保护,因此无法注册。专利局指出,GPT已经在许多其他环境中使用,并被其他公司在相关环境中使用。这对OpenAI的品牌是一个打击。

  据Axios 2月16日报道,根据美国联邦证券备案文件,Sam Altman除了OpenAI CEO这个身份外,还是企业风险基金OpenAI创业基金的所有者。OpenAI创业基金于2021年底推出,主要投资其他AI初创公司和项目,但它不归OpenAI所有,而是由Altman合法拥有。

  “我们希望快速启动,由于我们的结构,最简单的方法就是将其放在Sam的名字下。”OpenAI发言人告诉Axios,“我们一直希望这只是暂时的。”然而,这个“暂时”已经过去一年多了,这给OpenAI埋下了一个风险,OpenAI补充表示可能需要重新审查其治理结构,“在对基金进行任何变更之前进行”,其首要任务是“建立一个新的董事会”。

  谷歌2月16日开源AI驱动的文件类型识别系统Magika,以帮助更多人准确检测二进制和文本文件类型。Magika采用了一个定制的、高度优化的深度学习模型,即便在CPU上运行,也能在几毫秒内实现精确的文件识别。该工具已在谷歌内部被大规模使用,通过为Gmail、Drive和安全浏览文件规划到适当的安全和内容策略扫描器来帮助提高谷歌用户的安全性,每周平均处理数千亿个文件。与之前依赖人工规则的系统相比,Magika将文件类型识别准确率提高了50%。

  谷歌2月16日宣布启动一项新的AI网络防御计划,以帮助改变网络安全,并利用AI来扭转被称为“防御者困境”的动态。其中包括一项拟议的政策和技术议程,该议程载于谷歌新报告《安全、授权、进步:AI如何扭转防御者的困境》。谷歌将其AI工具Magika开源,为检测恶意软件提供助力。

  360集团创始人、董事长兼CEO周鸿祎分享一些观点,认为“今天Sora可能给广告业、电影预告片、短视频行业带来巨大颠覆,但它不一定那么快击败TikTok,更可能成为TikTok的创作工具”。他谈到Sora的技术思路完全不一样,通过把大语言模型和扩散模型结合,实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的。一旦AI接上摄像头,把所有电影、YouTube和TikTok上的视频看一遍,对世界的理解将远远超过文字学习,“这就离AGI线年的问题,可能一两年很快就可以实现”。周鸿祎相信OpenAI手里还藏有一些秘密武器。

  美国联邦贸易委员会(FTC)2月16日发布一篇声明,就针对基于生成式AI工具的伪造欺诈行为的拟议处罚规则向公众征求意见,以确定修订后的规则是否应宣布企业(如创建图像、视频或文本的AI平台)提供其知道或有理由知道的商品或服务被用来通过冒充来伤害消费者是非法行为。FTC致力于利用其所有工具来检测、阻止和制止假冒欺诈,阻止欺诈行为,并确保受害消费者得到赔偿。

  据路透社报道,咨询和法务会计公司Ankura Consulting 2月16日表示已推出一款定制的生成式AI工具NoraGPT,该工具是与OpenAI合作开发的。NoraGPT正在Ankura的安全环境中使用,以确保员工和客户的数据得到保护。该平台具有类似人类的功能,如长期和“永久”记忆能力,这与Ankura自家AI解决方案相一致。它还将有助于文件管理。

  据《纽约时报》报道,据三位知情人士透露,OpenAI已完成一笔交易,使其估值达到800亿美元或以上,在不到10个月的时间里这家创企的估值几乎增加了两倍。知情人士称,该公司将通过风险投资公司Thrive Capital牵头的要约收购出售现有股份。

  据彭博社2月17日援引知情人士报道,软银集团创始人孙正义正在寻求高达1000亿美元的资金来资助一家芯片合资企业,以与英伟达公司竞争并供应AI必需的芯片。软银正在考虑向中东投资者筹集资金。该项目代号为Izanagi,孙正义希望这家芯片公司能与软银芯片设计部门Arm Holdings形成互补,帮助其打造一家AI芯片巨头公司。

  据彭博社2月17日报道,OpenAI首席执行官萨姆阿尔特曼(Sam Altman)制定了一项计划,从根本上增加可用于开发和操作AI的专用服务器的数量。知情人士称,过去几周,阿尔特曼一直在与美国、中东和亚洲的潜在投资者和合作伙伴会面,但他告诉其中一些人,如果没有华盛顿的批准,他就无法前进。据知情人士透露,阿尔特曼正在努力争取美国政府批准一项大规模合资企业,以促进AI芯片的全球制造。

  据The Verge 2月17日报道,AI训练过程的能源消耗量极大,将比传统数据中心活动消耗更多的电力。例如,训练像GPT-3这样的大语言模型预计使用近1300MWh(兆瓦时)的电力,大约相当于130个美国家庭每年消耗的电量。如果流媒体播放一小时流媒体平台Netflix的视频需要大约0.0008MWh,这意味着用户需要观看超过162万小时视频才能消耗与训练GPT-3相同的电量。

  据The Information报道,最近几周,投资者表现出了对AI创企的极大热情,初创公司也正在寻求资本化。据多位知情人士透露,AI高质量训练数据提供商Scale AI一直在与投资者讨论筹集更多资金的事宜;AI搜索引擎创企Perplexity AI收到主动报价,估值可能超过10亿美元;高通和Intuit已向AI创企Anthropic投入了一轮150亿美元的估值融资;医疗AI创企Abridge完成新一轮融资,投资后估值为8.5亿美元。

  2月17日,在慕尼黑安全会议(MSC)上,微软、Meta、谷歌、亚马逊、OpenAI等20家科技公司组成的集团联合承诺,在今年的选举中打击AI错误信息。微软、Meta、谷歌、亚马逊等公司共同签署了《2024年选举中打击AI欺骗使用的技术协议(A Tech Accord to Combat Deceptive Use of AI in 2024 Elections)》,该协议有八项具体承诺,包括承诺部署技术来对抗AI生成的旨在欺骗选民的有害内容;签署方承诺合作开发工具,以检测和解决此类AI内容等。它还包括一套广泛的原则,包括追踪与选举相关的欺骗性内容起源的重要性,以及提高公众对这一问题认识的必要性。

  据彭博社2月17日报道,知情人士透露,Reddit已签署一份合同,允许一家公司根据社交媒体平台的内容训练其AI模型。知情人士称,Reddit告诉潜在投资者,该公司已于今年早些时候签署了该交易,按年计算价值约为6000万美元。

  据StataScoop报道,近日,加利福尼亚州参议员斯科特维纳(Scott Wiener)提出了一项法案,他提议在加州科技部设立一个名为“前沿模型部门”的新办公室,负责加强AI执法,例如确保大型AI模型在到达用户之前进行强制测试。


随便看看