인공지능 (AI)은 한때 인간의 입력이 필요했지만 이제 컴퓨터가 수행할 수 있는 여러 복잡한 신흥 기술을 포괄합니다. 컴퓨터는 이전에는 정보를 이해하고 추천하는 데 사용되었던 고급 기능을 실행할 수 있습니다. 이제 AI를 통해 컴퓨터가 새로운 콘텐츠를 생성할 수도 있습니다.
AI라는 약어는 AI 분야를 구성하는 다양한 유형의 기술을 나타내는 데 상호 교환적으로 사용되는 경우가 많습니다.
일반적인 AI 개념
인공지능과 머신러닝을 정의하는 여러 가지 용어 및 개념이 있으며, 이러한 용어와 개념은 유용할 수 있습니다. 다음은 웹에서 AI를 실제로 사용하는 방법입니다.
일반 AI
광범위하게 말하자면 일반 AI는 광범위한 문제 해결과 창의성을 보여주는 비인간 프로그램 또는 모델입니다. 모델은 머신이 출력을 반환하는 데 필요한 일련의 매개변수와 구조를 포함하는 매우 큰 수학 방정식입니다.
일반 AI를 사용하면 데이터 분석, 텍스트 번역, 음악 작성, 질병 식별 등 다양한 유형의 작업을 수행할 수 있습니다.
협소한 AI
Narrow AI는 단일 작업 또는 특정 하위 집합의 작업을 실행할 수 있는 시스템입니다. 예를 들어 인간 상대와 체스 게임을 하는 컴퓨터 (Mechanical Turk와 혼동해서는 안 됨)가 여기에 해당합니다. 협소한 AI에는 사전 정의된 일련의 매개변수, 제약 조건, 컨텍스트가 있습니다. 이는 이해하는 것처럼 보일 수 있지만 실제로는 방정식의 답일 뿐입니다.
얼굴 인식 시스템, 음성 어시스턴트, 날씨 예측에서 이러한 동작을 확인할 수 있습니다. 매우 구체적인 모델을 사용하여 웹사이트와 앱의 특정 기능을 개선할 수 있습니다.
예를 들어 사용자가 로그인하여 좋아하는 영화에 평점을 매기고 시청할 새로운 영화를 찾을 수 있는 영화 전용 사이트를 만들었습니다. 사전 채워진 데이터베이스를 사용하여 사용자가 방문 중인 현재 페이지를 기반으로 영화를 추천할 수 있습니다. 또는 사용자 행동과 선호도를 분석하여 해당 독자에게 가장 관련성 높은 정보를 표시하는 협소한 AI 모델을 사용할 수 있습니다.
생성형 AI
대규모 언어 모델 (LLM)은 텍스트 또는 이미지 생성, 분류, 요약과 같은 다양한 작업을 수행하는 데 사용할 수 있는 여러 매개변수가 있는 신경망 AI 모델입니다.
생성형 AI는 입력에 응답하고 LLM의 컨텍스트와 메모리를 기반으로 콘텐츠를 만듭니다. 이는 패턴 일치 및 예측을 넘어서는 것입니다. 가장 일반적인 생성형 AI 도구는 다음과 같습니다.
이러한 도구를 사용하면 서면 문구, 코드 샘플, 이미지를 만들 수 있습니다. 휴가를 계획하거나, 이메일의 어조를 부드럽게 하거나 전문적으로 표현하거나, 다양한 정보를 카테고리로 분류하는 데 도움이 됩니다.
개발자와 비개발자를 위한 사용 사례는 무궁무진합니다.
클라이언트 측, 서버 측, 하이브리드 AI
웹의 대부분의 AI 기능은 서버를 사용하는 반면 클라이언트 측 AI는 사용자의 브라우저에서 직접 실행됩니다. 이렇게 하면 지연 시간이 짧아지고, 서버 측 비용이 줄고, API 키가 필요하지 않으며, 사용자 개인 정보 보호가 강화되고, 오프라인 액세스가 가능해지는 등의 이점이 있습니다. Transformers.js, TensorFlow.js, MediaPipe 등의 JavaScript 라이브러리를 사용하여 브라우저에서 작동하는 클라이언트 측 AI를 구현할 수 있습니다.
서버 측 AI는 클라우드 기반 AI 서비스를 포함합니다. 클라우드에서 실행되는 Gemini 1.5 Pro를 생각해 보세요. 이러한 모델은 훨씬 더 크고 강력한 경향이 있습니다. 특히 대규모 언어 모델에서 이러한 문제가 자주 발생합니다.
하이브리드 AI는 클라이언트 구성요소와 서버 구성요소를 모두 포함하는 솔루션을 의미합니다. 예를 들어 클라이언트 측 모델을 사용하여 작업을 실행하고 기기에서 작업을 완료할 수 없는 경우 서버 측 모델로 대체할 수 있습니다.
최적화된 소형 클라이언트 측 모델이 더 큰 서버 측 모델보다 성능이 우수할 수 있습니다(특히 성능에 최적화된 경우). 사용 사례를 평가하여 적합한 솔루션을 결정합니다.
머신러닝(ML)
머신러닝 (ML)은 컴퓨터가 명시적인 프로그래밍 없이 학습하는 AI의 한 형태입니다. AI가 지능을 생성하기 위해 노력하는 반면, ML은 컴퓨터가 경험을 통해 학습할 수 있도록 합니다. ML은 데이터 세트를 예측하는 알고리즘으로 구성됩니다.
ML은 유용한 예측을 하거나 데이터에서 콘텐츠를 생성하도록 모델을 학습시키는 프로세스입니다.
예를 들어 특정 날짜의 날씨를 평가하는 웹사이트를 만들려고 한다고 가정해 보겠습니다. 전통적으로 이러한 작업은 지구의 대기와 표면을 나타내고, 날씨 패턴을 계산 및 예측하고, 현재 데이터를 이전 맥락과 비교하여 등급을 결정할 수 있는 한 명 이상의 기상학자가 수행할 수 있습니다.
대신 ML 모델에 엄청난 양의 날씨 데이터를 제공하여 모델이 날씨 패턴, 과거 데이터, 특정 날짜의 날씨가 좋거나 나쁜 이유에 관한 가이드라인 간의 수학적 관계를 학습할 때까지 기다릴 수 있습니다. 실제로 웹에서 빌드했습니다.
딥 러닝
딥 러닝 (DL)은 ML 알고리즘의 한 클래스입니다. 한 가지 예로 인간의 뇌가 정보를 처리하는 것으로 알려진 방식을 모델링하려는 심층신경망 (DNN)을 들 수 있습니다.
AI 관련 과제
AI를 빌드하고 사용할 때는 몇 가지 문제가 있습니다. 다음은 고려해야 할 몇 가지 주요 사항입니다.
데이터 품질 및 최신성
다양한 AI 모델을 학습하는 데 사용되는 대규모 데이터 세트는 사용 직후부터 오래된 경우가 많습니다. 즉, 최신 정보를 찾을 때 프롬프트 엔지니어링을 사용하여 특정 태스크에서 AI 모델의 성능을 개선하고 더 나은 출력을 얻을 수 있습니다.
데이터 세트가 불완전하거나 너무 작아서 일부 사용 사례를 효과적으로 지원하지 못할 수 있습니다. 여러 도구를 사용해 보거나 필요에 맞게 모델을 맞춤설정하는 것이 유용할 수 있습니다.
윤리 및 편향 관련 우려사항
AI 기술은 흥미롭고 잠재력이 무궁무진합니다. 하지만 궁극적으로 컴퓨터와 알고리즘은 사람이 만들고 사람이 수집할 수 있는 데이터를 기반으로 학습하므로 여러 가지 문제가 발생할 수 있습니다. 예를 들어 모델은 인간의 편향과 유해한 고정관념을 학습하고 증폭하여 출력에 직접적인 영향을 미칠 수 있습니다. AI 기술을 빌드할 때는 편향 완화를 우선으로 하는 것이 중요합니다.
AI 생성 콘텐츠의 저작권에는 여러 가지 윤리적 고려사항이 있습니다. 특히 저작권 보호 자료의 영향을 많이 받거나 이를 직접 복사한 경우 출력물의 소유권은 누구에게 있나요?
새로운 콘텐츠와 아이디어를 생성하기 전에 내가 만든 자료를 사용하는 방법에 관한 기존 정책을 고려하세요.
보안 및 개인 정보 보호
많은 웹 개발자가 AI 도구를 사용할 때 개인 정보 보호와 보안이 가장 우려되는 사항이라고 말했습니다. 이는 정부 및 의료 기업과 같이 엄격한 데이터 요구사항이 적용되는 비즈니스 환경에서 특히 중요합니다. 클라우드 API를 사용하여 더 많은 서드 파티에 사용자 데이터를 노출하는 것은 우려사항입니다. 데이터 전송은 안전하고 지속적으로 모니터링되어야 합니다.
이러한 사용 사례를 해결하는 데는 클라이언트 측 AI가 필요할 수 있습니다. 아직 연구 및 개발할 부분이 많이 남아 있습니다.
웹에서 AI 시작하기
이제 다양한 유형의 인공지능에 대해 익숙해졌으므로 기존 모델을 사용하여 생산성을 높이고 더 나은 웹사이트와 웹 애플리케이션을 빌드하는 방법을 고려해 볼 수 있습니다.
AI를 사용하여 다음 작업을 할 수 있습니다.
- 사이트 검색을 위한 자동 완성을 개선하세요.
- 스마트 카메라로 사람, 애완동물과 같은 일반적인 물체의 존재를 감지합니다.
- 자연어 모델로 댓글 스팸을 해결하세요.
- 코드에 자동 완성을 사용 설정하여 생산성을 개선하세요.
- 다음 단어 또는 문장에 대한 추천을 통해 WYSIWYG 작성 환경을 만듭니다.
- 데이터 세트에 대한 인간 친화적인 설명을 제공합니다.
- 기타...
사전 학습된 AI 모델은 수학적 모델을 빌드하고 가장 인기 있는 AI 도구의 기반이 되는 복잡한 데이터 세트를 수집하는 방법을 완전히 이해하지 않고도 웹사이트, 웹 앱, 생산성을 개선하는 데 큰 도움이 될 수 있습니다.
대부분의 모델은 추가 조정 없이 바로 요구사항을 충족할 수 있습니다. 조정은 이미 대규모 데이터 세트에서 학습된 모델을 사용하여 특정 사용 요구사항을 충족하도록 추가 학습하는 프로세스입니다. 모델을 조정하는 데는 여러 가지 기법이 있습니다.
- 인간 피드백 기반 강화 학습 (RLHF)은 인간의 피드백을 사용하여 모델이 인간의 선호도 및 의도에 맞게 조정되도록 개선하는 기법입니다.
- LoRA (Low-Rank Adaptation)는 학습 가능한 매개변수 수를 줄이면서 모델 성능을 유지하는 LLM용 매개변수 효율적인 방법입니다.