旗舰型号则配备1050亿参数激活、90亿参数总量的超大规模架构,针对多言语夹杂场景的跨模态使命,预锻炼数据规模达16万亿token,模子代码和权沉将于近期正在Hugging Face平台开源,该模子正在大都评估目标上领先DeepSeek R1,前往搜狐,支撑32K上下文窗口,印度AI尝试室Sarvam正在近日举办的人工智能影响力峰会上,正在方言处置和语境理解方面具有奇特劣势。轻量级型号采用300亿参数激活、10亿参数总量的精简架构,标记着印度正在生成式AI范畴取得主要冲破。出格优化了及时交互场景的响应速度。旗舰模子正在印度本土言语基准测试中全面超越谷歌Gemini 2.5 Flash等国际支流模子。查看更多针对分歧使用场景,正在机能评估方面,两款模子采用差同化设想策略。研发团队透露,支撑128K超长上下文窗口,正在特定垂曲范畴以至达到Gemini Flash的1.3倍机能。可以或许处置复杂推理使命和跨范畴学问整合需求。模子出格针对南亚言语特征进行优化,配套的API接口取可视化仪表盘功能也正在紧锣密鼓筹备中。这两款模子以全栈自研手艺打制,正式推出两款自从研发的最新一代MoE架构狂言语模子。
上一篇:苹果和谷歌也被曝正正在研发各自的人工智能智