马斯克旗下xAI发布创新模型Grok-1.5V 实现流程图到Python代码的转换
【HowToTech科技】4月13日消息,马斯克旗下的人工智能公司xAI继3月下旬推出Grok-1.5大语言模型后,于近日再度发布其首个多模态模型Grok-1.5
Vision(简称Grok-1.5V)。
xAI计划近期邀请早期测试者及现有的Grok用户参与Grok-1.5V的测试。新模型不仅增强了文本理解能力,更进一步扩展至处理各类文档、图表、截图及照片内容,展现出全方位的解析实力。
据HowToTech科技了解,Grok-1.5V的推出标志着xAI在多模态模型领域的重要突破。xAI自豪地宣称,Grok-1.5V在多学科推理、文档解析、科学图表解读、表格数据处理以及屏幕截图和照片分析等多个方面,均能与当前领先的多模态模型相媲美。
为了直观展示Grok-1.5V的能力,xAI在官方发布的新闻稿中详细演示了7个具体应用场景,其中包括将手绘白板上的流程图直接转化为Python代码、根据孩童的绘画作品生成富有想象力的睡前故事、解释网络流行语的含义,以及将图片中的表格数据快速转换为CSV文件格式等实用功能。
此外,xAI还分享了Grok-1.5V的性能测试结果。在RealWorldQA基准测试中,新模型的表现超越了GPT-4V、Claude
3Sonnet、Claude 3 Opus和Gemini Pro 1.5等一系列业界知名竞争对手,展现了卓越的性能和准确性。
延伸阅读:
OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens
【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战
7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型
“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式
【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...