가상 에이전트 슬롯 작성 권장 사항 및 제한 사항

가상 에이전트를 활성화하면 이를 사용하여 AI 기반 슬롯을 구성할 수 있습니다. Virtual Agent로 슬롯과 슬롯 유형을 구성하기 전에 Genesys 개발자가 대규모 언어 모델(LLM) 슬롯에 대해 권장하는 제한 사항, 고려 사항 및 팁을 검토하세요. 다음 표에서는 Virtual Agent에서 사용할 수 있는 슬롯 유형을 정의합니다.

슬롯 유형 설명
숫자 시퀀스

봇 참여자가 제공한 고정된 길이의 숫자 시퀀스입니다.

  • 신용카드 번호
  • 전화번호
  • PIN 코드
문자-숫자 조합

봇 참여자가 제공한 고정된 길이의 영숫자 시퀀스입니다.

  • 차량 번호판
  • 여권 신분증
자유형

봇 참여자가 주어진 설명과 함께 제공하는 자유형 시퀀스입니다.

  • 주소
  • 이름
  • 이메일 주소

다음 섹션에서는 슬롯 제한, 이러한 슬롯이 봇 참여자의 명시적 확인 및 부정을 처리하는 방법에 대한 정보와 구체적인 예를 설명합니다.

숫자 슬롯

봇이 추출된 시퀀스의 일부로 숫자만을 고려하도록 하려면 이 슬롯 유형을 사용합니다. 봇은 다른 문자를 인식하지 못합니다.

  • 설정된 maxLength 값을 초과하는 엔터티는 허용되지 않습니다. 예를 들어, 엔터티 값이 "123456"이고 maxLength가 7로 설정되어 있으며 고객이 "78"이라고 말하면 새로 추출된 엔터티가 "12345678"이고 길이가 이제 8이므로 봇은 새 엔터티를 noMatch로 처리하고 나머지를 "123456"으로 유지합니다.
  • 명시적이지 않거나 추출된 엔터티의 중간 부분에 있는 사례를 수정합니다. 다음 예에서 이전에 추출된 엔터티는 1299554464입니다.

    작동 수정의 예:
    • “마지막 두 자리는 64에서 62로 변경되지 않습니다”
    • “마지막 두 자리는 62여야 합니다”

작동하지 않는 수정의 예 :

    • “62번이에요.” LLM은 무엇을 변경해야 할지 결정할 수 없습니다.
    • "아니요, 62를 말하려고 했어요." LLM은 무엇을 변경해야 할지 결정할 수 없습니다.
    • “55를 44로 바꿔요.” 이 항목은 엔터티의 중간에 있기 때문에 LLM이 판단하기 어렵습니다.
    • "엔터티는 5로 시작해야 합니다." LLM은 시작 부분에 5를 추가하거나 예상대로 "1299554464"를 "5299554464"로 수정할 수 있습니다.
    • LLM은 숫자 값이 커져도 문제가 없지만, 숫자 값이 커질수록 수정이 더 어려워질 가능성이 커집니다. 숫자 값이 클수록 값의 시작이나 중간 부분을 수정하기가 더 어렵습니다. 이런 한계로 인해 Genesys는 다중 슬롯 방식의 사용을 권장하므로, 신용카드 번호를 추출하는 경우 4자리 단위로 데이터를 요청하세요. 마지막 4자리 내에서 실수가 발생하면 이를 수정하기가 더 쉽습니다.

    효과적인 사례는 다음과 같습니다.

    • 모든 길이의 간단한 숫자 추출. 예를 들어, "내 신용 카드 번호는 0123456789012232입니다."
    • 어휘 형식의 숫자를 여러 차례에 걸쳐 추출합니다. 예를 들어:
      • 참가자: “내 카드는 0011로 시작합니다” 봇: "지금까지 0011을 얻었습니다. 계속해 주세요."
      • 참가자: “그때는 7831″<i class=”fa-sharp fa-regular fa-arrow-right”></i> "지금까지 0011 7831을 받았습니다. 계속해 주세요."
      • 참가자: “세븐 원 더블 오”<i class=”fa-sharp fa-regular fa-arrow-right”></i> "지금까지 0011 7831 7100을 받았습니다. 계속해 주세요."
      • 참가자: “마침내 3333″<i class=”fa-sharp fa-regular fa-arrow-right”></i> "0011 7831 7100 3333인데 맞나요?"
    • 명확한 수정; 예를 들어, "마지막 두 자리를 84에서 82로 변경하세요."
    • LLM은 "Double"을 뒤에 오는 것의 2로 취급합니다. 예를 들어, double 2 = 22입니다. ASR은 우선 이 응답을 22로 변환해야 합니다. "트리플"/"트레블"은 그 숫자의 3개이고 "쿼드러플"은 4개입니다.
    • LLM은 예상된 상황에서는 "오"를 "0"으로 처리하고, "아, 미안합니다. 제 말은"과 같은 예상치 못한 상황에서는 처리하지 않습니다.

    : ASR에서 이를 포착하면 명확한 시정 조치를 잘 처리할 수 있습니다.

    문자 숫자 슬롯

    참가자가 음성 알파벳을 사용하는 경우 추출 중에 힌트를 제공하려면 이 슬롯 유형을 사용하십시오. 예를 들어, NATO 음성 알파벳 . 예를 들어, 사용자가 "알파를 위한 a"라고 말하면 추출된 문자는 "A"입니다.

    • 설정된 maxLength 값을 초과하는 엔터티는 허용되지 않습니다. 예를 들어, 엔터티 값이 "A12345"이고 maxLength가 7로 설정되고 고객이 "67"이라고 말하면 새로 추출된 엔터티가 "A1234567"이고 길이가 이제 8이므로 봇은 새 엔터티를 noMatch로 처리하고 엔터티 "A12345"를 유지합니다.
    • 여러 턴에 걸쳐 중복된 문자. 1턴차에 추출된 엔터티가 "AB78G"이고 다음 턴에 고객이 다른 "g"로 시작하는 경우 LLM은 실수로 "AB78GG" 대신 "AB78G"를 반환할 수 있습니다.
    • 모호한 수정 사항. 예를 들어, "아니요, AZ라고 말했어요." 고객이 1턴차에 "A는 사과, C는 72"라고 말했는데 이것이 "AC72"로 추출된 경우 모호한 수정이 발생할 수 있습니다. 다음 턴에 "아니요, AZ라고 했습니다"와 같이 어려운 수정을 할 수 있습니다.
    • LLM은 더 큰 영숫자 값에는 문제가 없지만, 더 큰 값을 사용하면 더 어려운 수정이 필요할 가능성이 커집니다. 숫자 값이 클수록 값의 시작이나 중간 부분을 수정하기가 더 어렵습니다. 이런 한계로 인해 Genesys는 다중 슬롯 특성을 사용하는 것을 권장합니다. 즉, 여권 번호를 추출하는 경우 3자리 단위로 데이터를 요청하세요. 마지막 3자리 안에 실수가 발생하면 이를 수정하기가 더 쉽습니다. 

    효과적인 사례는 다음과 같습니다.

    • 모든 길이의 영숫자 추출과 문자의 음성 철자, 간단히 표시된 문자 및 숫자. 예를 들어, "내 여권 번호는 애플의 a, 베타의 b, 찰리의 c, 그리고 d는 8909입니다."
    • 예를 들어 어휘 형식의 숫자를 사용하여 여러 차례에 걸쳐 영숫자 추출:
      • 참가자: “제 회원번호는 AB11로 시작합니다” 봇: "지금까지 AB11을 받았어요. 계속 읽어주세요."
      • 참가자: “그럼 c는 찰리, z는 제타” 봇: "지금까지 AB11 CZ를 얻었으니 계속 읽어주세요."
      • 참가자 : “베타 알파” 봇: "지금까지 AB11 CZ BA를 얻었습니다. 계속 읽어주세요."
      • 참가자: “드디어 99” 봇: "제가 받은 건 AB11 CZ BA 99인데 맞나요?"
    • 명확한 수정. 예를 들어, "아니요, 마지막 글자는 c가 아닌 Z(제타)여야 합니다."
    • LLM은 "Double"을 뒤에 오는 것의 2로 취급합니다. 예를 들어, double 2 = 22입니다. ASR은 우선 이 응답을 22로 변환해야 합니다. "트리플"/"트레블"은 그 숫자의 3개이고 "쿼드러플"은 4개입니다.
    • LLM은 예상된 상황에서는 "오"를 "0"으로 처리하고, "아, 미안합니다. 제 말은"과 같은 예상치 못한 상황에서는 처리하지 않습니다.

      : ASR에서 이를 포착하면 명확한 시정 조치를 잘 처리할 수 있습니다.

      자유 형식 슬롯

      봇이 캡처하려는 엔터티의 텍스트 설명을 인식하도록 하려면 이러한 슬롯을 사용합니다. 예를 들어, 도로명, 도시, PIN 코드가 포함된 주소입니다.

      메모 : 자유형 슬롯을 생성할 때 설명은 LLM이 엔터티의 부분과 형식을 올바르게 식별하는 데 영향을 미친다는 점을 고려하세요.

      • 구애
        • 특정 국가 표준에 따른 주소 형식입니다. 봇 참여자는 적절한 형식을 보장하기 위해 귀하가 제공한 설명을 신뢰해야 합니다.
        • 포장: 대소문자를 올바르게 사용하는 것이 일반적이지만, 추출된 엔터티가 가끔 모두 소문자 또는 모두 대문자로 반환될 수 있습니다.
      • 이메일
        • 여러 차례의 대화에서 사용자 정의 도메인 이름을 잘못 식별했습니다. 더 흔하고 정확한 반환은 이메일이 한 번에 제공될 때 발생합니다.
        • ASR 전사에서 대시, 마침표, 밑줄을 변환하지 못하는 경우입니다.
      • 이름
        • 긴 이름을 표기할 때 문자가 누락되거나 재배열됩니다.

      각 호출 후 모델 출력에는 추출된 엔터티와 부울 값의 두 부분이 포함됩니다. 부울 값은 추출이 완료되었는지 여부와 엔터티 감지 상태가 진행 중인지 완료인지를 나타냅니다. 자유형의 경우 봇은 제공된 설명을 사용합니다.

      • 모델은 설명을 사용하여 엔터티가 캡처되었는지 또는 설명에 언급된 부분이 누락되었는지 판단합니다. 설명에는 엔터티에 대한 내용과 엔터티의 다른 하위 엔터티 또는 일부가 포함되어야 하는 내용이 포함되어야 합니다.
      • 앞으로 건너뛸 수도 있습니다. 고객이 다음과 유사한 내용을 명확하게 말하는 경우:  "완료, 그게 다야, 그게 다야, 없어, 모르겠어" 등의 경우 추출 상태가 완료로 변경되고 설명에 따라 하위 엔터티 컬렉션이 재정의됩니다.

      자유 형식 슬롯 예시: 봇이 엔티티 감지 상태를 올바르게 판단할 수 있는 경우

      이러한 예에서 슬롯은 사람의 이름과 성을 설명하는 person_name입니다. 

      • 봇 참여자는 엔터티의 어떤 부분이 제공되는지 구체적으로 언급합니다.

      이미지를 클릭하면 확대됩니다. 제공된 엔터티의 성과 이름

      • 봇 참여자는 첫 번째 턴에서만 이름의 어느 부분이 제공되었는지 언급합니다. 이 모델은 봇 참여자가 제공하는 다음 하위 엔터티가 성이라고 가정합니다.

      이미지를 클릭하면 확대됩니다.
      person_name - 사람의 이름과 성. 사용자는 초기 턴에서 제공된 이름의 일부만 언급하고 모델은 제공되는 다음 하위 엔터티가 성이라고 가정합니다.

      • 두 하위 엔터티는 동시에 제공되며 첫 번째 턴 이후에는 상태가 완료로 변경됩니다.

      이미지를 클릭하면 확대됩니다. 두 하위 엔터티가 동시에 제공됩니다.

      • 봇 참여자가 제공되는 엔터티가 설명에 언급되지 않은 중간 이름이라고 지정했기 때문에 상태가 진행 중으로 유지됩니다. 예상대로 봇 참여자가 제공하는 다음 엔터티는 성으로 간주됩니다.

      이미지를 클릭하면 확대됩니다. 사용자가 제공되는 엔터티가 중간 이름임을 지정했기 때문에 상태가 진행 중으로 유지됩니다.

      • 봇 참여자가 명시하지 않았지만 "van der"가 성으로 추정되어야 하지만 "van der"는 흔히 사용되는 성 접두사이지 실제 성이 아니기 때문에 아마도 그렇지 않을 것입니다.

      이미지를 클릭하면 확대됩니다.
      사용자가 지정하지 않았고 van der가 성으로 가정되어야 했습니다.

      이러한 예에서 슬롯은 집 번호와 PIN 코드를 포함한 배송 주소를 설명하는 delivery_address입니다. 

      • 집 번호와 PIN 코드가 모두 제공될 때까지 대화가 진행 중입니다. 주소 시작 부분에 집 번호가 추가되고 주소 끝에 PIN 코드가 추가됩니다.

      이미지를 클릭하면 확대됩니다.
      집 번호와 핀 코드가 모두 제공될 때까지 진행 중입니다.

      • PIN 코드가 제공되지 않았지만 봇 참여자가 완료를 표시했기 때문에 상태가 완료로 변경됩니다. 참가자가 "그게 다입니다"라고 말하지 않으면 이 상태가 발생하지 않으며 PIN 코드가 제공되면 완료 상태로만 전환됩니다.

      이미지를 클릭하면 확대됩니다. 사용자가 완료를 표시했기 때문에 상태가 완료로 변경됩니다.

      자유 형식 슬롯 예시: 조기 종료 행동

      이러한 예에서는 집 번호와 PIN 코드가 포함된 배송 주소를 설명하는 delivery_address 슬롯에 대한 조기 종료 동작 시나리오를 설명합니다.

      • 예시 1 조기 종료 사례

      이미지를 클릭하면 확대됩니다.
      예시 1 조기 종료 예시: delivery_address - 집 번호와 우편번호를 포함한 배송 주소

      • 예시 2 조기 종료 사례.

      이미지를 클릭하면 확대됩니다.
      예시 2 조기 종료 예시: delivery_address - 주택 번호와 우편번호를 포함한 배송 주소. 

      • 예시 3 조기 종료 사례.

      이미지를 클릭하면 확대됩니다.
      예시 3 조기 종료 예시: delivery_address - 주택 번호와 우편번호를 포함한 배송 주소.

      • 예시 4 조기 종료 사례.

      이미지를 클릭하면 확대됩니다.
      예시 4 조기 종료 예시: delivery_address - 주택 번호와 우편번호를 포함한 배송 주소. 

      자유 형식 슬롯 캡처가 작동하는 방식을 보여주는 샘플 대화에 대한 정보는 다음을 참조하세요. 자유 형식 슬롯 캡처 예시 .

      일반적인 고려 사항

      • 슬롯 추출의 품질은 음성 채널에서 오디오를 텍스트로 변환하는 품질에 따라 달라집니다. 여기에는 "쓰레기가 들어가면 쓰레기가 나온다"는 개념이 적용됩니다. 전사 오류가 확산되기 때문입니다.
      • 고객에게 보내는 즉각적인 메시지에는 해당 엔티티가 한 차례 또는 여러 차례에 걸쳐 제공될 수 있다는 점을 언급해야 합니다.