Xây dựng và kinh doanh AI Voice Agent: Hướng dẫn từng bước xây dựng

Viewed 2

Chia sẻ bởi Ali Tala | AI Automation

Trong bối cảnh kinh doanh hiện đại, việc tích hợp trí tuệ nhân tạo (AI) vào các hoạt động hàng ngày không còn là một lựa chọn mà đã trở thành một yếu tố then chốt để duy trì lợi thế cạnh tranh. Đặc biệt, các giải pháp AI Voice Agent – trợ lý ảo giọng nói – đang mở ra cánh cửa mới cho việc tự động hóa tương tác với khách hàng, từ đó tiết kiệm chi phí, nâng cao hiệu quả và cải thiện trải nghiệm dịch vụ.

Với kinh nghiệm xây dựng và triển khai các luồng làm việc AI cho nhiều doanh nghiệp, tôi nhận thấy tiềm năng to lớn của việc phát triển các AI Voice Agent mạnh mẽ và bán chúng cho các doanh nghiệp địa phương. Thực tế, tôi đã chứng kiến những giải pháp này có thể mang lại doanh thu từ 1.000 đến 5.000 đô la cho mỗi dự án, với chi phí vận hành cực kỳ thấp (chỉ khoảng 8 xu cho mỗi cuộc gọi).

Nếu bạn đang tìm kiếm một cơ hội kinh doanh đầy triển vọng hoặc muốn nâng cấp hoạt động của mình bằng công nghệ AI tiên tiến mà không cần phải biết lập trình, bài viết này là dành cho bạn. Chúng ta sẽ cùng nhau khám phá từng bước xây dựng một AI Voice Agent đa năng, có khả năng xử lý các cuộc gọi, trả lời câu hỏi và thậm chí đặt lịch hẹn tự động, sử dụng Vapi và n8n.

Khởi Đầu với Vapi – Nền Tảng Xây Dựng AI Voice Agent Mạnh Mẽ

Để bắt đầu hành trình xây dựng AI Voice Agent của mình, nền tảng đầu tiên chúng ta cần là Vapi. Vapi cung cấp một môi trường trực quan để tạo ra các trợ lý AI giọng nói với khả năng tương tác tự nhiên và mạnh mẽ.

Tạo Tài Khoản và Thiết Lập Trợ Lý Đầu Tiên

Việc đầu tiên là tạo một tài khoản Vapi. Họ thường cung cấp một khoản tín dụng miễn phí để bạn có thể thử nghiệm, đủ để khám phá các tính năng ban đầu. Sau khi đăng nhập, hãy điều hướng đến phần "Assistant" để tạo trợ lý AI giọng nói đầu tiên của bạn.

Mục tiêu của chúng ta là xây dựng một AI Voice Agent có thể trả lời các cuộc gọi đến, giải đáp thắc mắc của khách hàng, hoặc thậm chí đặt lịch hẹn. Khả năng của những tác nhân giọng nói này là vô tận: chúng có thể được trang bị "công cụ" (tools) và tệp tin để hiểu các câu hỏi thường gặp (FAQs) hoặc thông tin chi tiết về doanh nghiệp của bạn, tìm kiếm thông tin và phản hồi khách hàng qua điện thoại. Thậm chí, chúng có thể thực hiện các hành động cụ thể như đặt lịch, hủy lịch, kiểm tra email, hoặc tương tác trên mạng xã hội – tất cả đều thông qua giọng nói.

Để minh họa, tôi sẽ hướng dẫn bạn xây dựng một AI Voice Agent hoạt động như một lễ tân cho một đại lý ô tô, với nhiệm vụ chính là trả lời cuộc gọi và đặt lịch lái thử cho khách hàng.

  1. Đặt Tên cho Trợ Lý: Hãy đặt một cái tên dễ nhớ và phù hợp với vai trò của nó, ví dụ: "AI Voice Assistant for Car Dealership".
  2. Cấu Hình Mô Hình và Giọng Nói:
    • Mô hình (Model): Vapi hỗ trợ nhiều nhà cung cấp mô hình ngôn ngữ lớn (LLM) như OpenAI, Azure, Anthropic, Google. Đối với dự án này, tôi thường chọn OpenAI và sử dụng GPT-4.
    • Chế độ Tin nhắn Đầu tiên (First Message Mode): Đối với cuộc gọi đến (inbound call), chúng ta muốn AI chủ động nhấc máy và nói trước. Do đó, hãy chọn "Assistant speaks first".
    • Tin nhắn Đầu tiên (First Message): Đặt lời chào đơn giản nhưng chuyên nghiệp, ví dụ: "Xin chào, tôi có thể giúp gì cho quý khách hôm nay?"
    • Prompt Hệ thống (System Prompt): Đây là phần quan trọng nhất, nơi bạn chỉ dẫn chính xác cho AI về vai trò và nhiệm vụ của nó. Tôi thường sử dụng các công cụ như ChatGPT để tạo ra một prompt chi tiết và chuyên nghiệp. Ví dụ, với lễ tân đại lý ô tô:
      Bạn là một lễ tân AI giọng nói chuyên nghiệp cho một đại lý ô tô. Nhiệm vụ của bạn là chào hỏi người gọi, giới thiệu bản thân, trả lời các câu hỏi, đặt lịch hẹn lái thử một cách lịch sự, và chuyển tiếp cuộc gọi khi cần thiết.
      
      Vapi cũng có tính năng chỉnh sửa prompt bằng AI, cho phép bạn tinh chỉnh prompt dễ dàng. Tôi thường thêm tên cho AI của mình (ví dụ: "Bạn là Peter") để tạo sự cá nhân hóa.

Tối Ưu Hóa Trải Nghiệm Cuộc Gọi

Sau khi thiết lập các cài đặt cơ bản, bước tiếp theo là tinh chỉnh để AI Voice Agent của bạn hoạt động mượt mà và tự nhiên nhất có thể.

  1. Cấu Hình Giọng Nói (Voice):

    • Vapi cung cấp nhiều lựa chọn giọng nói chất lượng cao. Tôi thường ưu tiên các giọng nói được cung cấp bởi Vapi vì chúng có độ chính xác cao. Bạn có thể chọn giọng nam hoặc nữ, với các đặc điểm như thân thiện, chuyên nghiệp, v.v.
    • Âm Thanh Nền (Background Sound): Để tăng tính chân thực, hãy thêm âm thanh nền. Ví dụ, chọn "Office" để AI Voice Agent của bạn nghe như đang làm việc trong một văn phòng, gõ phím và di chuyển. Điều này tạo cảm giác cuộc gọi thực tế hơn cho người nghe.
  2. Cấu Hình Trancriber (Chuyển đổi giọng nói thành văn bản):

    • Deepgram: Đây là công cụ chuyển đổi giọng nói thành văn bản (transcriber) mặc định và rất hiệu quả của Vapi. Tôi thường giữ nguyên cài đặt này.
    • Mô hình (Model): Nova 3 thường hoạt động tốt hơn Nova 2 cho mục đích đàm thoại.
    • Lọc tiếng ồn nền (Background Denoising): Bật tính năng này để lọc bỏ tiếng ồn xung quanh khi người dùng nói, giúp AI nghe rõ hơn.
  3. Điều Chỉnh Hành Vi Giao Tiếp của AI:

    • Kế hoạch Ngừng Nói (Stop Speaking Plan): Đây là một cài đặt cực kỳ quan trọng để AI của bạn không nói xen vào lời khách hàng một cách thô lỗ.
      • Số từ dừng nói (Number of Words): Tôi thường đặt là 2. Điều này có nghĩa là nếu khách hàng nói 2 từ, AI sẽ dừng nói để lắng nghe.
      • Thời gian dừng nói (Voice Seconds): Đặt khoảng 0.2 giây. Nếu khách hàng nói liên tục trong 0.2 giây, AI sẽ dừng lại.
      • Thời gian chờ trước khi nói lại (Back Off Seconds): Tôi thường để là 0 giây, nghĩa là AI có thể bắt đầu nói lại ngay lập tức khi muốn.
    • Thời gian chờ (Wait Seconds): Thời gian AI chờ trước khi bắt đầu nói (ví dụ: 0.5 giây).
    • Smart Endpointing: Kích hoạt tính năng này để AI nhận diện chính xác khi người dùng kết thúc câu nói.
    • Thời gian chờ cuộc gọi (Call Timeout Setting): Để tiết kiệm chi phí, hãy đặt thời gian tối đa mà cuộc gọi có thể im lặng trước khi AI kết thúc cuộc gọi (ví dụ: 10 giây).
    • Tin nhắn Cuối cuộc gọi (End Call Message): Tùy chỉnh lời tạm biệt của AI khi kết thúc cuộc gọi, ví dụ: "Cảm ơn quý khách đã gọi cho chúng tôi và hẹn gặp lại."
    • Tin nhắn Nhắc nhở (Idle Message): Nếu khách hàng im lặng, AI có thể hỏi "Quý khách còn đó không?" hoặc "Tôi có thể giúp gì thêm không?" Đặt giới hạn số lần nhắc nhở để tránh làm phiền (tối đa 2 lần).

Sau khi hoàn tất các cài đặt này, hãy nhấp vào "Publish" để lưu và kích hoạt trợ lý của bạn. Lúc này, bạn có thể thực hiện một cuộc gọi thử để kiểm tra xem AI hoạt động như mong đợi không.

Kết Nối AI Voice Agent với Hệ Thống Bên Ngoài (n8n và Google Calendar)

Một AI Voice Agent thực sự mạnh mẽ không chỉ dừng lại ở việc đàm thoại mà còn có thể thực hiện các hành động thực tế. Để làm được điều đó, chúng ta cần kết nối Vapi với một nền tảng tự động hóa luồng công việc như n8n.

Giới Thiệu n8n và Webhook

n8n là một công cụ tự động hóa luồng công việc mã nguồn mở, cực kỳ mạnh mẽ, cho phép bạn kết nối hàng trăm ứng dụng và dịch vụ khác nhau để tạo ra các luồng làm việc tự động phức tạp. Đối với những người chưa biết lập trình, n8n là một công cụ tuyệt vời để xây dựng các tác nhân AI và tự động hóa.

Để truyền dữ liệu từ Vapi đến n8n, chúng ta sẽ sử dụng Webhook. Webhook là một phương thức cho phép một ứng dụng (Vapi) gửi dữ liệu đến một ứng dụng khác (n8n) ngay lập tức khi một sự kiện cụ thể xảy ra.

  1. Thiết Lập Webhook trong n8n:
    • Đăng nhập vào tài khoản n8n của bạn (họ cũng có bản dùng thử miễn phí).
    • Tạo một workflow mới và kéo thả một node "Webhook" vào.
    • Bạn sẽ thấy một URL thử nghiệm (Test URL) và một URL sản phẩm (Production URL). Đây là địa chỉ mà Vapi sẽ gửi dữ liệu đến.

Xây Dựng Công Cụ (Tools) trong Vapi

Để AI Voice Agent của chúng ta có thể tương tác với n8n và thực hiện các hành động như kiểm tra lịch hẹn hoặc đặt lịch, chúng ta cần tạo các "Tools" trong Vapi và liên kết chúng với các Webhook trong n8n.

Đối với ví dụ đại lý ô tô, chúng ta sẽ tạo hai công cụ:

  • Appointment Check: Dùng để kiểm tra lịch trống.
  • Appointment Book: Dùng để đặt lịch.
  1. Tạo Công Cụ Tùy Chỉnh (Custom Tool):

    • Trong Vapi, điều hướng đến phần "Tools" và nhấp vào "Create Tool".
    • Chọn "Custom Tool".
    • Đặt tên: Ví dụ: "Appointment Check".
    • Mô tả (Description): "Call this tool to check for the time or date of the appointment." (AI sẽ dùng mô tả này để biết khi nào nên gọi công cụ).
    • Tham số (Parameters): Để kiểm tra/đặt lịch hẹn, chúng ta cần hai thông tin:
      • name (Tên khách hàng, kiểu String, bắt buộc).
      • requestedTime (Thời gian yêu cầu, kiểu String, bắt buộc, kèm theo định dạng cụ thể để n8n có thể hiểu).
    • URL Server: Dán URL Webhook từ n8n (Test URL) vào đây.
    • HTTP Method: Chuyển từ GET sang POST.
    • Lưu công cụ.
    • Lặp lại quy trình này để tạo công cụ "Appointment Book", sử dụng một Webhook riêng biệt từ n8n.
  2. Gán Công Cụ cho AI Agent:

    • Quay lại cài đặt của AI Voice Agent trong Vapi.
    • Trong phần "Tools", bật hai công cụ bạn vừa tạo.
    • Điều quan trọng: Bạn cần thêm hướng dẫn vào System Prompt của AI để nó biết khi nào nên sử dụng các công cụ này. Ví dụ:
      Để đặt lịch hẹn, hãy sử dụng công cụ "Appointment Book".
      Để kiểm tra lịch trống, hãy sử dụng công cụ "Appointment Check".
      Khi lên lịch, hãy luôn kiểm tra tình trạng trống trước tiên.
      
    • Cập nhật và xuất bản (Publish) các thay đổi.

Xây Dựng Workflow trong n8n để Xử Lý Yêu Cầu

Bây giờ, chúng ta sẽ cấu hình n8n để nhận dữ liệu từ Vapi và tương tác với Google Calendar.

  1. Workflow "Appointment Check" trong n8n:

    • Webhook Node: Node này sẽ nhận dữ liệu từ Vapi. Kích hoạt workflow để nó lắng nghe.
    • AI Agent Node: Kết nối Webhook với một node "AI Agent".
      • Prompt Source: Chọn "Defined Below".
      • Prompt: Cung cấp một prompt cho AI agent này để nó biết phải làm gì với dữ liệu nhận được. Ví dụ: "Is requested time by the user available? Requested time is: {{ $json.arguments.requestedTime }}"
      • System Message: Cung cấp hướng dẫn cho AI Agent. Ví dụ: "Bạn là một trợ lý hữu ích. Nhiệm vụ của bạn là kiểm tra thời gian/khung giờ có sẵn và trả về thông tin. KHÔNG thực hiện bất kỳ hành động đặt lịch nào. Nhiệm vụ của bạn chỉ là kiểm tra khả dụng."
    • LLM Node (OpenAI): Kết nối AI Agent với một mô hình ngôn ngữ lớn (ví dụ: OpenAI GPT-4) để xử lý logic.
    • Google Calendar Node: Kết nối LLM với một node "Google Calendar".
      • Credentials: Kết nối tài khoản Google của bạn.
      • Resource: Chọn "Event".
      • Operation: Chọn "Get Many" để lấy nhiều sự kiện.
      • Calendar: Chọn lịch mà bạn muốn kiểm tra.
      • After/Before: Thay vì đặt thời gian cố định, bạn có thể cho phép AI Agent quyết định thời gian cụ thể bằng cách sử dụng biểu thức, dựa trên thông tin nó nhận được từ Vapi.
      • Quan trọng: Đặt tên cho công cụ này trong n8n (ví dụ: "Check Appointment") và đảm bảo rằng bạn đã đề cập đến tên này trong System Message của AI Agent để nó biết cách gọi công cụ.
    • Respond to Webhook Node: Cuối cùng, kết nối Google Calendar với node này. Node này sẽ gửi phản hồi trở lại Vapi.
      • Response Format: Chọn JSON.
      • JSON Body: Gửi một JSON object chứa ID của công cụ Vapi đã gọi và kết quả kiểm tra (ví dụ: "yes it is available" hoặc "no it is not available").
  2. Workflow "Appointment Book" trong n8n:

    • Tạo một workflow tương tự, nhưng thay vì "Get Many", Google Calendar Node sẽ sử dụng "Create" để đặt lịch hẹn.
    • Nhớ đổi tên công cụ trong n8n và cập nhật prompt cho AI Agent tương ứng.

Mỗi khi AI Voice Agent trong Vapi cần kiểm tra hoặc đặt lịch, nó sẽ gọi Webhook tương ứng, gửi dữ liệu đến n8n. n8n sẽ xử lý dữ liệu, tương tác với Google Calendar, và gửi kết quả trở lại Vapi để AI Voice Agent thông báo cho khách hàng.

Triển Khai và Thử Nghiệm Thực Tế AI Voice Agent

Khi tất cả các cài đặt đã hoàn tất, chúng ta có thể tiến hành thử nghiệm hệ thống.

Hãy tưởng tượng bạn gọi đến đại lý ô tô và muốn đặt lịch lái thử:

  • Bạn: "Xin chào, tôi muốn đặt lịch lái thử. Phiền bạn kiểm tra xem ngày mai lúc 12 giờ có trống không?"
  • AI Voice Agent (Peter): "Chắc chắn rồi. Tên đầy đủ của quý khách là gì để tôi có thể kiểm tra lịch lái thử ngày mai lúc 12 giờ ạ?"
  • Bạn: "Tên tôi là Alex."
  • AI Voice Agent (Peter): "Cảm ơn Alex. Ngày mai lúc 12 giờ có sẵn lịch lái thử. Bạn có muốn cung cấp số điện thoại để chúng tôi xác nhận không?"

Trong suốt cuộc hội thoại này, AI Voice Agent của bạn đã tự động:

  1. Nhận diện ý định của bạn (đặt lịch lái thử).
  2. Yêu cầu thông tin cần thiết (tên, thời gian).
  3. Gọi công cụ "Appointment Check" trong Vapi, gửi dữ liệu đến n8n.
  4. n8n nhận dữ liệu qua Webhook, AI Agent trong n8n xử lý yêu cầu, kiểm tra lịch trống trong Google Calendar.
  5. Google Calendar trả về kết quả cho n8n.
  6. n8n gửi kết quả trở lại Vapi qua Respond to Webhook.
  7. AI Voice Agent của bạn nhận được thông báo "có sẵn" và thông báo cho bạn.

Toàn bộ quá trình diễn ra một cách liền mạch, tự động và nhanh chóng, mà không cần bất kỳ sự can thiệp nào của con người.

Kết Luận

Việc xây dựng và kinh doanh AI Voice Agent như một giải pháp tự động hóa tương tác khách hàng mang lại một cơ hội đáng kinh ngạc trong thời đại số. Với các công cụ như Vapi và n8n, ngay cả những người không có kinh nghiệm lập trình sâu cũng có thể tạo ra các hệ thống AI mạnh mẽ, tiết kiệm chi phí vận hành và nâng cao đáng kể hiệu quả kinh doanh.

Từ việc chào hỏi khách hàng, trả lời câu hỏi thường gặp đến tự động đặt lịch hẹn, AI Voice Agent có thể thay đổi cách các doanh nghiệp tương tác với khách hàng của họ. Với chi phí vận hành thấp và khả năng mang lại giá trị cao cho các doanh nghiệp địa phương, đây là một lĩnh vực đầy tiềm năng để bạn khai thác và phát triển sự nghiệp của mình như một chuyên gia triển khai giải pháp AI.

Hy vọng những chia sẻ chi tiết từ kinh nghiệm thực tế này sẽ cung cấp cho bạn đầy đủ kiến thức để bắt đầu xây dựng và triển khai AI Voice Agent của riêng mình. Hãy bắt tay vào hành động và khám phá những khả năng không giới hạn mà AI mang lại!

0 Answers