美华头条6月28日报道——美国加州山景城,Google在6月24日推出Gemini 3.5 Flash的computer use能力,使该模型可支持AI代理执行网页、移动端和桌面操作;Gemini 3.5 Pro延后至7月发布,也使外界对Google模型路线、AI代理可靠性和前沿模型竞争的关注升温。
此次更新使Gemini 3.5 Flash从快速响应模型进一步进入AI代理执行层。根据Google公布的产品方向,开发者可通过Gemini API和企业平台调用相关能力,让AI代理识别屏幕内容、理解网页或应用界面,并执行点击、输入、滚动、检索和跨页面操作等任务。
这一调整的直接结果是,Google正在把Gemini从问答型模型推向可操作、可调用、可嵌入的自动化系统。过去一年,人工智能行业的竞争重点已从文本生成扩展到代码编写、工具调用、数据处理和跨平台执行。对企业用户而言,模型能否稳定完成表单处理、网页操作、软件测试、内部系统检索和工作流自动化,正在成为衡量其实用价值的重要标准。
Google优先强化Gemini 3.5 Flash,显示其对规模化部署和成本控制的重视。Flash系列并非单纯追求最高推理能力,而是强调响应速度、调用成本和多场景适配。看重企业部署效率的观点认为,AI代理如果要进入真实工作流程,不能只依赖最昂贵、最复杂的模型,还需要具备高频运行、成本可控、响应迅速和易于整合的特点。
在这一定位下,Gemini 3.5 Flash的优势主要集中在速度、成本、多模态处理和生态连接。该模型适合实时交互和连续任务,也更容易被用于大量调用场景。对于需要处理网页、文档、图片、视频和搜索任务的用户而言,Flash的价值不只在于单次回答质量,还在于能否稳定嵌入现有产品和业务流程。
不过,Gemini系列在复杂任务中的表现仍存在争议。开发者群体中,一类意见更关注编码能力和长流程执行效果,认为模型在大型代码库、复杂项目拆解、多步骤代理任务和错误恢复方面仍需进一步验证。对软件开发者而言,模型是否能够保持上下文一致、减少调试负担、降低返工成本,是判断其是否适合生产环境的关键。
另一类观点则认为,AI模型评价不应只围绕编程场景展开。文档整理、研究辅助、图片识别、视频理解、会议纪要、企业知识库检索、搜索增强和跨应用信息处理,都是实际使用中占比很高的需求。按照这一看法,Gemini的竞争力可能不只体现在代码任务上,也可能体现在多模态理解、长上下文处理和Google产品生态的协同能力上。
Google的优势在于其庞大的产品入口和基础设施。搜索、Chrome、Android、Workspace、YouTube和Google Cloud都为Gemini提供了潜在应用场景。如果AI代理能够在这些环境中稳定执行任务,Gemini的商业价值将不只是回答问题,而是帮助用户在不同工具之间完成实际操作。
持谨慎态度的观点则指出,AI代理的风险高于普通聊天模型。普通模型回答错误,用户通常可以重新提问或人工核对;但具备computer use能力的代理可能直接操作网页、修改内容、提交表单或访问系统。一旦模型误解任务、错误点击或受到提示注入影响,可能造成数据泄露、业务中断或不可逆操作。
Google在相关开发说明中也强调,computer use能力仍需要人类监督。涉及敏感信息、金融交易、账号权限、企业系统和关键决策时,应设置用户确认、权限限制、安全策略和沙盒环境。这表明AI代理虽然正在进入实际应用,但在完全自主执行重要任务之前,仍需要明确边界和人工审核机制。
Gemini 3.5 Pro延后至7月发布,使市场对Google高端模型能力的观察继续延后。Pro版本通常承担更复杂推理、长上下文处理、代码任务和企业级工作流。其发布后的表现,将影响开发者和企业用户对Google前沿模型能力的判断。
从行业格局看,Google面临来自多个方向的竞争。OpenAI在通用助手、开发平台和企业工具上保持强势影响力;Anthropic在代码代理、长文本处理和开发者口碑中持续扩大存在感;Meta通过开放权重模型影响开发者社区和本地部署市场。Google的优势则集中在基础设施、产品入口、多模态数据环境和长期AI研究积累。
在企业部署场景中,模型评价标准已不只限于推理能力和生成质量。速度、价格、任务完成率、工具调用准确性、安全边界、审计能力和生态整合,正在共同决定模型能否被长期采用。Gemini 3.5 Flash强化AI代理能力,正是Google试图在这些指标之间寻找平衡的一步。
对Google而言,Gemini 3.5 Flash承担的是规模化AI代理角色,Gemini 3.5 Pro则被期待承担高能力前沿模型角色。前者强调快速、低成本和广泛部署,后者需要在复杂任务中证明Google仍具备前沿竞争力。两条路线能否形成互补,将影响Gemini 3.5系列在下一阶段AI竞争中的位置。
目前,Gemini 3.5 Flash的代理化升级已经把Google推入AI自动化工具竞争的更前端。Gemini 3.5 Pro在7月发布后的表现,将继续影响开发者和企业用户对Google模型路线、复杂任务能力和企业部署前景的判断。

读者评论
0 条评论