发布时间:2024 年 2 月 17 日;最后更新时间:2025 年 4 月 22 日
人工智能 (AI) 涵盖了许多复杂的新兴技术,这些技术过去需要人工输入,现在可以由计算机执行。广义而言,AI 是一种非人类的程序、模型或计算机,可展现出广泛的问题解决能力和创造力。计算机可以执行高级功能,这些功能以前用于理解和推荐信息。借助生成式 AI,计算机甚至可以生成新内容。
AI 一词通常可互换使用,表示人工智能领域中的各种类型的技术,但 AI 功能可能差异很大。
您可以在此处找到许多与实际应用中的 AI 相关的术语和概念,这些术语和概念也适用于网络。 如需详细了解机器学习,请查看机器学习术语表。
AI 是怎么运作的?
训练是每个模型的第一个步骤,在此步骤中,机器学习工程师会构建一种算法,为模型提供特定输入并展示最佳输出。一般来说,Web 开发者无需执行此步骤,但了解特定模型的训练方式可能会有所帮助。虽然可以对模型进行微调,但最好还是花时间为任务选择最佳模型。
推理是指模型根据新数据得出结论的过程。模型在特定领域的训练越多,推理生成有用且正确输出的可能性就越大。不过,无论模型接受了多少训练,都无法保证推理结果完全正确。
例如,绿灯使用基于 Google 地图数据训练的 AI 模型来了解交通模式。随着接收到的数据越来越多,系统会执行推理,以提供优化红绿灯的建议
AI 在何处执行?
AI 训练会在模型发布之前完成。我们可能会进行进一步的训练,从而推出具有更多功能或更高准确率的新版模型。
Web 开发者应关注 AI 推理的执行位置。使用 AI 的费用在很大程度上受到推理的影响。单个模型的功能范围也受到很大影响。
客户端 AI
虽然网络上的大多数 AI 功能都依赖于服务器,但客户端 AI 在用户浏览器中运行,并在用户设备上执行推理。这可实现更低的延迟时间、更低的服务器端费用、无需 API 密钥、更高的用户隐私保护和离线访问。您可以使用 JavaScript 库(包括 Transformers.js、TensorFlow.js 和 MediaPipe)实现可在各种浏览器中运行的客户端 AI。
小型优化型客户端模型有可能胜过大型服务器端模型,尤其是在针对性能进行优化的情况下。评估您的使用情形,确定适合您的解决方案。
服务器端 AI
服务器端 AI 涵盖基于云的 AI 服务。将 Gemini 1.5 Pro 视为在云端运行。这些模型往往更大、更强大。对于大语言模型来说,这一点尤其重要。
混合 AI
混合 AI 是指包含客户端和服务器组件的任何解决方案。例如,您可以使用客户端模型执行任务,并在设备上无法完成任务时回退到服务器端模型。
机器学习 (ML)
机器学习 (ML) 是指计算机在无需明确编程的情况下学习和执行任务的过程。AI 致力于生成智能,而 ML 则包含用于预测数据集的算法。
例如,假设我们想要创建一个网站,用于评定任意给定日期的天气。传统上,这可能由一位或多位气象学家完成,他们可以创建地球大气层和地表的表示形式,计算和预测天气模式,并通过将当前数据与历史背景进行比较来确定评级。
相反,我们可以向机器学习模型提供大量天气数据,直到该模型学习到天气模式、历史数据与有关特定日期天气好坏的指导原则之间的数学关系。事实上,我们在 Web 上构建了此功能。
生成式 AI 和大语言模型
生成式 AI 是一种机器学习技术,可帮助用户创建熟悉的内容,并模仿人类的创作方式。 生成式 AI 使用大语言模型来整理数据,并根据提供的上下文创建或修改文本、图片、视频和音频。生成式 AI 不仅能进行模式匹配和预测。
大语言模型 (LLM) 具有大量(通常是数十亿)参数,可用于执行各种任务,例如生成、分类或总结文本或图片。
聊天机器人已成为人们使用生成式 AI 的热门工具,包括:
这些工具可以生成书面散文、代码示例和艺术作品。它们可以帮助您规划假期、柔化或专业化电子邮件的语气,或者将不同的信息集分类。
无论是开发者还是非开发者,都可以将 Gemini 用在各种各样的场景中。
深度学习
深度学习 (DL) 是一类机器学习算法。一个例子是深度神经网络 (DNN),它试图模拟人类大脑处理信息的方式。
深度学习算法可以经过训练,将图片中的某些特征与特定标签或类别相关联。经过训练后,该算法可以做出预测,识别新图片中的同一类别。例如,Google 相册可以识别照片中猫和狗的区别。
自然语言处理 (NLP)
自然语言处理是一类机器学习技术,专注于帮助计算机理解人类语言,从任何特定语言的规则到个人使用的特有表达方式、方言和俚语。
AI 带来的挑战
在构建和使用 AI 时,会遇到一些挑战。以下仅列出了一些您应考虑的重点。
数据质量和新近度
用于训练各种 AI 模型的大型数据集通常在投入使用后很快就会过时。这意味着,在寻求最新信息时,您可能需要通过提示工程来提高 AI 模型在特定任务上的表现,并生成更好的输出。
数据集可能不完整或太小,无法有效支持某些使用情形。 尝试使用多种工具或自定义模型以满足您的需求可能会很有用。
道德和偏见方面的问题
AI 技术令人兴奋,并且具有巨大的潜力。不过,计算机和算法最终是由人类构建的,并使用可能由人类收集的数据进行训练,因此会面临多项挑战。例如,模型可能会学习并放大人类偏见和有害的刻板印象,直接影响输出结果。在构建 AI 技术时,务必要优先考虑偏差缓解。
关于 AI 生成的内容的版权,存在许多伦理方面的考虑因素;谁拥有输出内容的所有权,尤其是当输出内容受到版权材料的严重影响或直接从版权材料复制时?
在生成新内容和创意之前,请先了解有关如何使用您所创建材料的现有政策。
安全和隐私设置
许多网络开发者表示,在使用 AI 工具时,隐私和安全是他们最关心的问题。在有严格数据要求的业务环境中(例如政府机构和医疗保健公司),这一点尤其重要。通过云 API 将用户数据暴露给更多第三方是一个令人担忧的问题。任何数据传输都必须安全可靠,并且要持续监控。
客户端 AI 可能是解决这些使用情形的关键。我们还需要进行更多研发工作。
开始在网络上使用 AI
现在,您已经熟悉了多种类型的人工智能,可以开始考虑如何使用现有模型来提高工作效率,并构建更好的网站和 Web 应用。
您可以使用 AI 执行以下操作:
- 为网站搜索打造更出色的自动补全功能。
- 使用智能摄像头检测常见物体(例如人或宠物)的存在
- 使用自然语言模型处理垃圾评论。
- 启用代码自动补全功能,提高工作效率。
- 提供下一个字词或句子的建议,打造 WYSIWYG 写作体验。
- 提供数据集的直观易懂的说明。
- 更多其他应用…
预训练的 AI 模型可以成为改进网站、Web 应用和提高工作效率的绝佳方式,而无需完全了解如何构建数学模型和收集复杂的数据集来为最热门的 AI 工具提供支持。
您可能会发现,大多数模型无需进一步调整即可满足您的需求。 调优是指在已使用大型数据集训练过的模型的基础上,进一步训练模型以满足您的特定使用需求。有多种技术可用于调优模型:
- 基于人类反馈的强化学习 (RLHF) 是一种使用人类反馈来提高模型与人类偏好和意图的一致性的技术。
- 低秩自适应 (LoRA) 是一种针对 LLM 的参数高效方法,可减少可训练参数的数量,同时保持模型性能。