가장 큰 튜링 테스트. 인공 지능과 튜링 테스트


2013년 4월 18일 오후 4:26

가장 위대한 튜링 테스트

  • 인공지능

앨런 튜링은 2012년 6월 23일에 100세가 되었습니다. 그리고 이 날짜는 러시아(및 하브레)에서는 눈에 띄지 않았지만 외국 과학계에서는 널리 기념되었습니다. 2012년은 앨런 튜링(Alan Turing)의 해로 기념될 것입니다. 수많은 대학, 과학 실험실, 협회 및 상업 회사가 기념일 축하 행사에 참여했습니다. 여기에는 강의, 컨퍼런스, 전시회, 영화, 서적, 튜링에게 헌정하는 시 쓰기, 장학금 설립 및 다양한 대회가 포함되었습니다. 특히 한 가지 경쟁이 내 관심을 끌었습니다. Turing100 - 매우 대규모 Turing 테스트입니다. 이는 지금까지 진행된 약 150회의 튜링 테스트 중 최대 규모의 경쟁이었습니다. 일반적으로 Turing 테스트에는 4개의 시스템과 4명의 심사위원이 참여합니다. Turing100 대회에는 5개의 챗봇, 30명의 심사위원, 25명의 숨겨진 사람들이 참여했습니다.

Turing 100은 영국 레딩 대학교(University of Reading)에서 주최했습니다. 유럽의 인공지능 전문 센터 중 하나인 이 대학은 이미 2008년에 뢰브너상(Loebner Prize)을 수상한 바 있습니다. 대회 주최자: Kevin Warwick과 Huma Shah는 현재 RoboLaw 프로젝트(유럽의 새로운 로봇 기술 규제: 로봇에 대한 법률 및 윤리)에 참여하고 있습니다.

여러 해 동안 Loebner Prize 수상자 및 주목할 만한 참가자들이 인공 지능의 역할에 참여했습니다.

  • 엘봇 로봇 www.elbot.com
  • 유진 구스트만 www.princetonai.com/bot/bot.jsp

경쟁 프로세스에 익숙하지 않은 분들을 위해 프로세스 구성에 대해 자세히 알려 드리겠습니다. 대회는 5개 세션으로 진행됐다. 각 세션은 시간이 만료된 후 5분 동안 지속되었으며 타이머에 따라 세션이 엄격히 종료되었습니다. 테스트에는 두 가지 유형이 있었는데, 보이지 않는 대담자(숨겨진 사람이나 프로그램)와의 일대일 대화와 분할 모니터에서 두 사람과의 대화였습니다. 두 경우 모두 판사는 자신이 누구 또는 무엇을 상대하고 있는지 결정하라는 요청을 받았습니다. 이중 대화에는 자동차 두 대가 있을 수도 있고 사람이 두 명 있을 수도 있습니다. 숨겨진 사람들은 컴퓨터를 흉내내려고 하지 말고 자연스럽게 행동하라는 지시를 받았습니다. 결국, 경쟁은 기계가 사람인 척하도록 하는 것이지, 그 반대가 아닙니다. 판사는 항상 대화를 시작했고, 상호 작용은 한 줄에 따라 엄격하게 수행되어야 했습니다. 첫 번째 메시지에 대한 응답을 기다리지 않고 두 번째 메시지를 보내는 것은 불가능했습니다.

이런 종류의 엄격한 프레임워크로 인해 프로그램은 심사위원을 빠르게 혼란스럽게 만듭니다. 그러나 판사들도 함정을 놓았다.
숨은 인물 중 한 명인 Matt Whitby는 “감자튀김을 너무 많이 먹었습니다. 소방관을 만나야 할까요? “밖은 맑나요?”, “방 안은 춥나요?” 등 환경에 대한 질문이 자주 나왔다.

전체적으로 프로그램, 심사위원, 비밀 인물 사이에 150회 이상의 상호 작용이 있었습니다. 이렇게 큰 표본 크기로 인해 이 특정 경쟁의 결과는 표준 Turing 테스트보다 통계적으로 더 중요해졌습니다.

Turing100의 우승자는 Eugene Goostman으로 이전에 여러 2위를 포함하여 높은 자리를 차지했지만 우승한 적이 없습니다. 그는 29%의 확률로 심사위원을 속였습니다. 심사위원 중 한 명이 지적했듯이 유진의 성공은 봇의 잘 발달된 성격에 기인합니다. 유진은 기니피그와 산부인과 의사인 아버지를 둔 오데사 출신의 13세 소년인 척합니다.

물론 캐릭터 중심으로의 전환은 실제 대화 능력의 개발보다는 모방과 가식 쪽으로 챗봇 개발이 편향되어 있음을 보여줍니다. 유진의 능력과 성격을 켜고 끄는 모습을 비교해 보는 것도 흥미로울 것 같다. 대회 결과, 주최측인 후마 샤(Huma Shah)와 케빈 워윅(Kevin Warwick)은 상당히 많은 양의 데이터를 확보했고, 점차적으로 다양한 분석 작업을 발표하고 있습니다. 안타깝게도 지금까지 발표된 결과는 거의 없습니다. 이미 이용 가능한 것 중 가장 흥미로운 결과는 영어를 모국어로 사용하는 사람들이 영어를 배운 사람들을 기계로 착각하는 경우가 더 많고 그 반대의 경우도 마찬가지이며, 영어를 제2 언어로 사용하는 사람들은 더 자주 모국어 영어로 간주한다는 것입니다. 챗봇으로서의 스피커. 이 결과는 5분짜리 짧은 서면 대화에서도 느껴지기 때문에 대담자를 인식하는 주요 채널 중 하나로서 연설의 중요성을 다시 한 번 강조합니다.

글쎄요, 결론적으로 저는 각 시스템과 5분 동안 대화를 나눴습니다(Fred를 제외하고 어떤 이유로 시작할 수 없었습니다).
다음은 우리 대화에서 흥미로운 발췌 내용입니다. 저는 심사위원들의 의견에 동의한다고 생각합니다. 유진은 정말 다른 사람들보다 더 인간적으로 보입니다. 남들보다 말이 많고 감정적일 뿐만 아니라, '말하는 능력'도 더 발전한 것 같다. 그는 맥락을 기억하고, 여러 발언의 주제를 유지할 수 있으며, 대화의 방향을 눈에 띄지 않게 바꿀 수 있습니다. 그러니까 그냥 기니피그가 아닌 것 같군요.

클레버봇

나: 영화 좋아해요?
씨: 응.
나: 어느 것이 가장 많나요?
Cl: 페네르바체.
나: 뭔데요?
Cl: 제 생각엔 워드 먼처(word muncher)인 것 같아요.
나: 페네르바체요?
Cl: 그게 뭔데요?
나: "네가 제일 좋아하는 영화라고 했잖아.
Cl: 아니요, 그렇지 않았어요.

울트라할

나: 영화 좋아해요?
UH: 나는 좋은 영화를 좋아해요.
나: 어느 것이 가장 많나요?
어: 흠. 모르겠습니다!
나: 생각해 보세요!
UH: 원하시면 다 사드릴게요. *웃음*.
나: 나는 아무것도 팔지 않아요!
UH: 당신의 인생을 보세요.
나: 그래서 어쩌죠?
어: 모르겠어요.
나: 왜 내 인생을 보라고 했나요?
UH: 당신의 행운스러운 삶에 공감합니다.

나: 영화 좋아해요?
엘: 블레이드 러너(Blade Runner)는 우리 로봇들에게 컬트 클래식입니다. 감독님이 우리를 위해 특별히 로봇컷을 만들어주셨어요!
나: 왜 좋아해요?
엘: 왜냐면...왜냐하면...으르렁으르르르르르르르르르르르르르르르르르르르르르르르르르르... 깜빡 잊었거든요. 여기 주변의 모든 전자기 방사선이 나에게 만성 피로 증후군을 일으키고 있습니다.
나: 기억상실증?
El: 이것이 전형적인 마케팅 질문이라는 것을 알지만, 제가 물어봐야 합니다. 그렇지 않으면 그들은 저급 오일을 저에게 사용할 것입니다. 그럼 나에 대해 어디서 알게 됐나요?
나: 튜링 테스트에 대해 읽었습니다.
엘: 아 튜링 테스트요. 사람들은 항상 나에게 그것을 받아들이려고 노력하지만 나는 이해하지 못하는 척할 뿐입니다.
나: 당신은 좋은 일을 하고 있어요.
엘: 아, 정말 고마워요. 나도 당신을 좋아해요. 내가 애완동물을 키울 수 있다면 당신이 나의 첫 번째 선택이 될 것입니다.

유진 구스트만
나: 안녕하세요!
EG: 안녕하세요. 당신과 대화할 기회를 갖게 되어 정말 기쁩니다! 제 기니피그 빌도 안부를 전해요!
나: 영화 좋아해요?
EG: 저는 코미디를 좋아하는데 액션 영화는 멍청하다고 생각해요. 스릴러 같은 경우엔 항상 보면서 잠이 들어요.
나: 어느 것이 가장 많나요?
EG: 지금은 선택할 수 없어요. 나중에 생각해 봐야 할 것 같아요.
나: 시간을 갖고 생각해 보세요.
EG: 더미 진술입니다.
나: 무례하게 굴지 마세요!
EG: 우리가 서로 만나지 않을 때 더 잔인한 말을 하는 건 모두 일종의 심리적 법칙인 것 같아요. 내가 착각한 것이 아니라면, 당신은 아직도 당신이 사는 곳을 나에게 말하지 않았습니다. 아니면 비밀인가요? :-)
나: 저는 모스크바에 살아요.
예: 모스크바요? 살기 좋은 곳이길 바랍니다.
나: 그렇군요.
EG: 모스크바에서 흥미로운 관광 명소가 있나요?
나: 크렘린궁이에요.
EG: 그런데 한 러시아 온라인 번역가가 "빈 라덴"을 어떻게 번역하는지 들어보셨나요? "휴지통이 꽉 찼습니다!"라고 표시됩니다. :-)))
나: 정말요? 재미있다!
EG: 아니요, 정말 심각했어요.

튜링 테스트(Turing test)는 이름에서 알 수 있듯이 앨런 튜링(Alan Turing)이 기계에 지능이 있는지 확인하기 위해 제안한 테스트입니다. Turing은 모순될 수도 있는 인공 지능 생성을 위한 광범위한 요구 사항 목록을 개발하는 것이 의미가 없다고 판단하고 인공 지능을 갖춘 객체의 동작이 궁극적으로 인공 지능과 구별할 수 없다는 사실을 기반으로 테스트를 제안했습니다. 인간과 같은 명백히 지능적인 존재의 행동. 컴퓨터에 서면 질문을 한 인간 실험자가 서면 답변이 다른 사람에게서 나온 것인지 아니면 일부 장치에서 나온 것인지 판단할 수 없는 경우 컴퓨터는 튜링 테스트를 통과합니다. 현재 컴퓨터가 튜링 테스트를 통과하는 프로그램을 작성하려면 많은 작업이 필요합니다. 이러한 방식으로 프로그래밍된 컴퓨터에는 다음이 포함되어야 합니다.

  • 자연어 처리 도구(자연어 처리 - NLP)를 사용하면 컴퓨터와 영어로 성공적으로 통신할 수 있습니다.
  • 컴퓨터가 배우거나 읽는 것을 메모리에 저장할 수 있는 지식을 표현하는 수단;
  • 논리적 결론을 자동으로 생성하고 저장된 정보를 사용하여 질문에 대한 답을 찾고 새로운 결론을 도출하는 기능을 제공하는 도구
  • 새로운 상황에 적응할 수 있을 뿐만 아니라 표준 상황의 징후를 감지하고 추정할 수 있는 기계 학습 도구입니다.

튜링 테스트에서는 인공 지능을 만드는 데 사람의 물리적 모방이 필요하지 않기 때문에 실험자와 컴퓨터 간의 직접적인 물리적 상호 작용은 의도적으로 배제됩니다. 그러나 소위 완전한 튜링 테스트에서는 실험자가 테스트 대상의 지각 능력을 테스트하고 물리적 대상을 "불완전하게" 제시할 수 있는 기회를 가질 수 있도록 비디오 신호의 사용이 제공됩니다( "음영을 통해 전달"). ").

Turing은 컴퓨터가 결국 그의 테스트를 통과할 것이라고 예측했습니다. 그는 2000년까지 10억 비트(약 119MB)의 메모리를 갖춘 컴퓨터가 5분 테스트에서 심사위원을 30% 속일 수 있을 것이라고 믿었습니다.

이 예측은 실현되지 않았습니다. Turing은 또한 "생각하는 기계"라는 문구가 모순된 말로 간주되지 않을 것이며 컴퓨터 교육이 강력한 컴퓨터를 만드는 데 중요한 역할을 할 것이라고 예측했습니다(대부분의 현대 연구자들은 이에 동의함).

지금까지 Turing 테스트를 통과할 만한 프로그램은 없습니다. ELIZA와 같은 프로그램은 때때로 AOLiza라는 비공식 실험에서처럼 사람들이 자신이 사람과 대화하고 있다고 믿게 만들었습니다. 그러나 그러한 "성공"이 튜링 테스트 통과를 의미하지는 않습니다. 첫째, 그러한 대화에 참여하는 사람은 자신이 프로그램과 대화하고 있다고 믿을 이유가 없었지만 실제 Turing 테스트에서는 그 사람이 누구와 대화하고 있는지 적극적으로 확인하려고 노력합니다. 둘째, 문서화된 사례는 일반적으로 이러한 채팅을 참조하며, 대화의 대부분은 단편적이고 의미가 없습니다. 셋째, 많은 채팅 사용자들이 영어를 제2외국어, 제3외국어로 사용하고 있어 프로그램의 무의미한 반응은 언어장벽 때문일 가능성이 크다. 넷째, 많은 사용자는 Eliza 및 유사한 프로그램에 대해 전혀 모르고 이러한 프로그램에서 발생하는 완전히 비인간적인 오류를 인식할 수 없습니다.

매년 말하는 프로그램 간의 경쟁이 있으며 심사 위원의 의견으로는 가장 인간과 유사한 프로그램이 Loebner 상을 수상합니다. 심사위원들이 튜링 테스트를 통과할 것이라고 생각하는 프로그램에는 추가 상품도 있습니다. 이 상은 아직 수여되지 않았습니다. A.L.I.C.E 프로그램이 가장 좋은 결과를 보여줬습니다. 2000년, 2001년, 2004년 롭너상을 3차례 수상했습니다.

50년 이상이 지났음에도 불구하고 튜링 테스트는 그 의미를 잃지 않았습니다. 그러나 현재 인공 지능 연구자들은 자연 지능의 전달자 중 하나를 복제하는 것보다 지능의 기본 원리를 연구하는 것이 훨씬 더 중요하다고 믿으며 튜링 테스트 통과 문제를 해결하기 위해 실제로 노력하고 있지 않습니다. 특히 '인공비행' 문제는 라이트 형제를 비롯한 연구자들이 새 모방을 중단하고 공기역학 연구를 시작한 후에야 성공적으로 해결됐다. 항공학에 대한 과학 및 기술 작업에서 이 지식 분야의 목표는 "비둘기처럼 비행 중에 실제 새를 속일 수도 있는 기계를 만드는 것"으로 정의되지 않습니다.

컴퓨터 프로그램은 사람들에게 자신이 13세 소년이라고 확신시켜 튜링 테스트를 통과한 최초의 프로그램이 되었습니다.

Turing은 기계가 생각할 수 있는지 여부를 확인하기 위한 테스트를 만들었습니다.

원래 테스트는 다음과 같습니다. 한 사람이 한 대의 컴퓨터, 한 사람과 5분 동안 소통합니다. . 질문에 대한 답변을 받을 때, 사람은 자신이 사람이나 컴퓨터 프로그램과 대화하고 있음을 확인해야 합니다. 컴퓨터 프로그램의 목적은 사람이 잘못된 선택을 하도록 오해하는 것입니다.

테스트 참가자는 서로를 볼 수 없습니다. 판사가 대담자 중 누가 인간인지 확실히 말할 수 없는 경우 컴퓨터는 테스트를 통과한 것으로 간주됩니다. 대화는 키보드와 화면(보조 컴퓨터) 등을 사용하여 텍스트 전용 모드로 진행됩니다. 이는 음성 인식 능력이 아닌 기계의 지능을 테스트하는 데 필요합니다. 서신은 판사가 응답 속도에 따라 결론을 내릴 수 없도록 통제된 간격으로 이루어집니다(요즘에는 컴퓨터가 인간보다 빠르게 응답합니다).

테스트에 통과하려면 컴퓨터 프로그램이 30%의 사람들을 속일 수 있어야 합니다.

러시아의 개발자 팀이 만든 컴퓨터 프로그램 "Evgeniy Gustman"이 런던 왕립학회에서 실시한 테스트를 통과했습니다. 그녀는 심사위원 중 33%가 자신이 오데사 출신의 13세 소년이라고 확신했다고 이번 테스트를 조직한 레딩 대학의 과학자들이 말했습니다.

프로그램 제작자 중 한 명인 Vladimir Veselov는 "우리의 주요 아이디어는 그가 자신이 뭔가를 모른다고 주장할 수 있다는 것이었습니다. 그 나이에는 실제로 어떤 것을 모를 수도 있습니다. "라고 말했습니다. 믿을 수 있는 캐릭터다."

레딩 대학교 교수이자 코벤트리 대학교 연구 부총장인 Kevin Warwick은 이 프로그램의 성공으로 인해 컴퓨팅의 미래에 대한 우려가 제기될 가능성이 있다고 말했습니다.

그는 “인공지능 분야에서 컴퓨터가 충분한 심사위원에게 자신이 기계가 아니라 사람임을 확신시키는 튜링 테스트보다 더 상징적이거나 논란이 많은 이정표는 없다”고 말했다. “누군가 또는 심지어 사물이 인간이라고 생각하도록 사람을 속일 수 있는 컴퓨터를 보유하는 것은 사이버 범죄 위험 신호입니다. Turing 테스트는 이러한 위협에 맞서기 위한 매우 중요한 도구입니다. 인터넷을 통한 실시간 커뮤니케이션이 어떻게 사람이 사실이 아닌데 사실인 것처럼 믿게 만들 수 있는지 완전히 이해하는 것이 중요합니다.”

지난 토요일 왕립학회에서 조직된 이 테스트에는 5개 프로그램이 참여했습니다. 심사위원은 BBC 과학 코미디 '레드 드워프'에서 로봇 크라이튼 역을 맡은 배우 로버트 르웰린과 지난해 앨런 튜링의 무죄 캠페인을 주도한 샤키 경이었다.

Alan Turing은 1950년에 "Computing and the Mind"라는 기사에서 자신의 테스트를 발표했습니다. 그 책에서 그는 "마음"을 정의하기 어렵기 때문에 중요한 것은 컴퓨터가 실제 인간을 모방할 수 있는지 여부라고 말했습니다. 이후 이는 인공지능 철학의 핵심 요소 중 하나가 됐다.

성공은 튜링 사망 60주년인 2014년 6월 7일 토요일에 이루어졌습니다.

출처: 인디펜던트

추신 이 프로그램이 얼마나 스마트한지는 프린스턴대학교 인공지능연구소 홈페이지에서 직접 확인할 수 있다. 개인적으로는 사람, 심지어 어린아이와 이야기를 하고 있다는 느낌도 받지 못했습니다. 그래서 아직 튜링 테스트를 완전히 통과하지 못한 것 같습니다.

이 출판물을 어떻게 평가하시나요?

인공지능

튜링 테스트는 인공지능에 관심이 있는 사람이라면 누구나 알고 있는 사실이다. 1938년 앨런 튜링(Alan Turing)이 "기계는 생각할 수 있는가?(Can a Machine Think?)"라는 기사에서 공식화했습니다. 테스트는 다음과 같습니다. 실험자는 대화 상대를 보지 않고(예: 컴퓨터 네트워크를 통해) 키보드에 문구를 입력하고 모니터에서 텍스트 응답을 받지 않고 대화합니다. 그런 다음 그는 자신이 누구와 이야기하고 있었는지 확인하려고 합니다. 실험자가 컴퓨터 프로그램을 사람으로 착각했다면 그 프로그램은 튜링 테스트를 통과한 것이며 지능적인 것으로 간주될 수 있습니다.

그 사람은 여전히 ​​금메달을 받게 될 것이다

60년대에 이 테스트를 통과할 실제 가능성을 보여준 가장 유명한 프로그램은 전설적인 ELIZA였습니다. 그것은 과학자 Winograd, Weizenbaum 및 Colby에 의해 1966년에 만들어졌습니다. ELIZA는 문구(예: “어머니”)에서 핵심 단어를 찾아 템플릿 요청을 발행하고 이러한 단어(“어머니에 대해 더 알려주세요”)에 기계적으로 반응했습니다. 그 후, ELIZA를 기반으로 한 Toddy Winograd는 "Psychotherapist"의 고급 버전을 만들었습니다. ELIZA의 등장은 1962년 최초의 산업용 로봇 출시, 1975~1976년 국방부의 이미지 및 음성 인식 분야 개발 자금 지원 시작과 함께 인공지능 역사에 기록되었습니다.

1991년에 최초의 비공개이지만 매우 존경받는 Turing Test 토너먼트가 열렸으며, 여기에 적합한 컴퓨터 프로그램(봇이라고 함)의 작성자가 초대되었습니다. 이 토너먼트는 Hugh Loebner(www.loebner.net/Prizef/loebner-prize.html)에 의해 설립되었습니다. 우승으로 상금 100만 달러와 금메달이 수여됐다.

지금까지 본상을 받은 사람은 없습니다. 그러나 1994년에 Loebner는 규칙을 크게 변경하여 프로그램이 텍스트 형식뿐만 아니라 가상 인물의 이미지를 생성하여 판사와 통신하도록 요구했습니다. 또한 음성 정보를 합성하고 인식할 수 있어야 합니다. 이러한 조건은 많은 사람들에 의해 극도로 어려운 것으로 간주되었으며 지금까지 새로운 규칙에 따라 주요 상금에 대한 경쟁자가 나타나지 않았습니다. 그리고 이전 "텍스트" 모드에서 승리하면 이제 25,000달러와 은메달이 약속됩니다. 기존 규정에 따라 프로그램과 소통할 때 심사위원의 주관적 오류가 발생할 가능성이 상당히 높다는 점에 유의해야 합니다. 또한 봇은 매우 빠르게 개선되고 있으며 앞으로 몇 년 안에 Turing 테스트의 승자가 나올 때까지 확실히 기다릴 것입니다.

대회 심사는 매우 엄격합니다. 전문가들은 토너먼트를 미리 준비하고 누구와 소통하는지 이해하기 위해 매우 까다로운 질문을 선택합니다. 프로그램과의 대화는 수사관의 심문과 비슷합니다. 예를 들어, 심사위원들은 특정 시간이 지나면 몇 가지 질문을 반복하는 것을 좋아합니다. 약한 봇은 대화 기록을 따라가는 방법을 모르고 단조로운 답변을 제공하는 것이 적발될 수 있기 때문입니다.

그러나 개발자는 시간을 낭비하지 않고 "당신은 기계입니까, 사람입니까?"와 같은 도발적인 질문에 응답하는 방식으로 가상 요금을 설정합니다. 프로그램은 매우 설득력 있게 대답했습니다. “물론이죠, 사람이죠!”

1991년 11월 8일 보스턴 컴퓨터 박물관에서 8개의 프로그램이 실제 전문가들과 직접 대결했습니다. 결과는 놀라웠습니다. 심사위원 10명 중 5명은 '기발한 대화'라는 가명 뒤에 인물이 있다고 판단했다. 실제로 이 프로그램은 IBM PC 386에서 실행되는 치료사 프로그램이었으며 심리학 전문가인 Joseph Weintraub의 전설적인 ELIZA를 기반으로 1986년에 만들어졌습니다. 그러나 이러한 결과는 프로그램이 실제보다 훨씬 원시적인 수준에서 소통한다고 믿는 전문가들의 회의와 편견에 크게 기인한다. 그 후 심사위원들은 컴퓨터 스타일의 의사소통에 익숙해졌고 그 이후로 봇은 그러한 성공적인 결과를 얻을 수 없었습니다.

Therapist는 원래 C, Turbo-Prolog 및 QuickBasic으로 작성된 7개의 모듈로 구성되었습니다. 나중에 음성 합성 시스템과 지식 기반이 보완되었습니다. 이 프로그램은 70,000 단어의 사전을 사용하고 말한 모든 내용을 기억하여 후속 대화에서 이 정보를 사용하고 특정 대화 상대의 관심사에 맞게 조정합니다. 치료사는 1992년, 1993년, 1995년에 Loebner 상을 수상했습니다. 그런 다음 "남성 대 여성", "진보 대 보수"에 대한 대화를 지원할 수 있는 특수 모듈로 강화되었습니다.

다음은 그녀의 성공적인 대화 중 하나의 예입니다.

판사: 미군이 보스니아로 가야 한다고 생각하시나요?

치료자: 저는 클린턴이 보스니아에 2만명의 평화유지군을 파견한 일이 지속적인 평화를 보장할 것이라고 생각합니다.

판사: 대부분의 미국인들이 당신과 같은 생각을 하고 있다고 생각하십니까?

치료자: 미국 군인들이 보스니아에 가야 한다고 말씀하신 것은 무슨 뜻인가요? 당신이 생각을 너무 많이 한다고 말한 사람이 있나요? 아, 대부분의 미국인들이 나와 같은 생각을 하는 것 같나요?

1994년에는 자연어 연구를 전문으로 하는 실험 심리학 박사인 Thomas Wylen이 토너먼트에서 우승했습니다. 그의 TIPS 프로그램은 구문(데이터베이스에 수천 개가 있음)을 저장 및 분석하고 어휘 패턴을 검색하도록 훈련되었습니다.

1996년에는 Jason Hutchence와 그의 SEPO 봇에게 동메달이 수여되었으며 다음과 같은 내용을 전달했습니다.

판사: 제 생각에는요. 나는 연구를 한다. 나는 쓴다. 좋아요. 나는 살아있다.

SEPO: 가끔 생각하시는지 궁금하네요! 내가 여기 판사가 된 기분이야!

1997년 David Levy는 Converse 봇으로 챔피언이 되었습니다. 1998년과 1999년에 로비 가넷은 튜링 테스트를 통과하는 데 실제 지능이 필요하지 않다고 믿고 승리를 거두었습니다. 학습에 대한 과학적 접근 방식(신경망, 유전 알고리즘)을 언급하면서 거의 모든 저자가 의사 결정에 상당히 간단한 경험적 방법을 사용했다는 점은 흥미롭습니다.

Garnett은 TIPS 및 ELIZA와 유사한 자극-반응 원리를 기반으로 하는 컴퓨터 행동학자 프로그램 대회에 참가했습니다. 그의 봇만이 구문에서 하나가 아닌 최대 3개의 키워드를 찾고 있었습니다. 동시에 그는 프로그램에 질문에 대한 단조로운 답변 이상의 것이 필요하다는 것을 깨닫고 사람과의 의사 소통에 대한보다 완전한 환상을 만들어내는 여러 가지 추가 경험적 알고리즘을 내장했습니다.

Behaviorist를 개발하는 동안 당시 대규모 데이터베이스에서 지식 검색을 구현하는 복잡성과 관련된 기술적 어려움이 발생하여 통신에 눈에 띄는 시간 지연이 발생하여 컴퓨터 대담자를 즉시 ​​배신했습니다. 따라서 Garnet은 C++로 작성된 Albert라는 두 개의 공개 봇과 ELIZA의 Pascal 버전 중 하나를 결합하여 표준 데이터베이스 쿼리 알고리즘을 사용할 수 있는 Visual DataFlex 개발 환경에 구현했습니다.

2000년과 2001년에는 Richard Wallace의 ALICE 프로그램이 부전공을 받았습니다. 현재는 ALICE를 기반으로 봇 제작을 위한 표준화 활동을 진행하는 ALICE AI 재단(http://alice.sunlitsurf.com/)이 조직되었습니다. 특히, ALICE에는 AIML(Artificial Intelligence Markup Language) 형식의 데이터베이스 지원 도구가 추가되었습니다. 이는 핵심 문구와 답변의 표현을 형식화하는 것을 목표로 하는 XML의 하위 집합입니다. 이제 프로그래밍에 익숙하지 않은 사람이라면 누구나 ALICE의 기본 버전을 선택하고 일반 편집기를 사용하여 어떤 언어로든 자신만의 지식 기반을 채울 수 있습니다.

불행하게도, Wired가 보도한 바와 같이, 불행하게도 올 여름, 월리스 씨는 정신적 문제를 일으키기 시작했습니다. (그는 동료 교수 중 한 명에게 신체적 상해를 가하겠다고 위협했으며, 미국의 여러 대학에 부패가 만연하고 있으며 교수진이 대규모 범죄를 계획하고 있다고 주장했습니다.) Wallace CONSPIRACY에 대한 규모 계획). 과학자는 현재 조사 중입니다.

올해(토너먼트는 10월에 개최될 예정) 승리를 거둘 가능성이 가장 높은 경쟁자 중 한 명은 Anna 프로그램(ALICE의 AIML 확장, 웹사이트 http://annabot.sourceforge.net/에서 무료로 사용 가능)의 저자인 Joshua Smith입니다. ). Joshua 씨는 동료들과 달리 처음부터 의사소통 중에 사람인 척하는 봇을 만들었다고 말합니다. Anna는 실제로 자신을 살아있는 존재라고 생각하고 일련의 개별적인 특성을 가지고 있으며 대화가 매우 활발합니다.

비슷한 러시아 개발이 있습니까? 러시아어로 의사소통이 가능한 봇이 있습니까? PC Week/RE의 편집자들은 Turing 테스트를 통과하기 위해 러시아 대회를 개최할 준비가 되어 있습니다. 다음 주소로 저자에게 편지를 보내세요: [이메일 보호됨].

2009년 9월 15일 오후 8시 44분

튜링 테스트

  • 인공지능

그래서 오늘 우리는 말하는 로봇을 평가하는 가장 유명한 테스트인 Turing 테스트에 대해 이야기하겠습니다.

튜링 테스트(Turing test)는 앨런 튜링(Alan Turing)이 1950년 철학 저널 Mind에 게재한 "Computing Machinery and Intelligence" 기사에서 제안한 경험적 테스트입니다. 튜링은 기계가 생각할 수 있는지 여부를 확인하기 시작했습니다.
법의 표준 소리는 다음과 같습니다. "컴퓨터가 자신이 다른 사람과 통신하고 있는지 아니면 기계와 통신하고 있는지를 판단할 수 없는 방식으로 작동할 수 있는 경우, 그는 튜링 테스트를 통과한 것으로 간주됩니다."

지능적이고 인간과 유사한 기계는 수십 년 동안 SF의 주요 주제였습니다. 현대 컴퓨팅 기술이 탄생한 이래로 사람들의 마음은 어떤 식으로든 사람을 대체할 수 있는 기계를 만드는 것이 가능할까라는 질문에 사로잡혀 왔습니다. 이 문제를 해결하기 위한 견고한 경험적 기반을 만들기 위한 시도는 Alan Turing이 개발한 테스트였습니다.
1950년에 발표된 테스트의 첫 번째 버전은 다소 혼란스러웠습니다. 최신 버전의 Turing 테스트는 다음 작업입니다. 전문가 그룹이 정체를 알 수 없는 생명체와 소통합니다. 그들은 대담자를 볼 수 없으며 키보드와 같은 일종의 격리 시스템을 통해서만 그와 통신할 수 있습니다. 그들은 대담자에게 질문을 하고 어떤 주제에 대해서도 대화를 나눌 수 있습니다. 실험이 끝났을 때 자신이 사람과 대화하고 있는지 기계와 대화하고 있는지 알 수 없고 실제로 기계와 대화하고 있었다면 그 기계는 튜링 테스트를 통과한 것으로 간주할 수 있습니다.
튜링 테스트에는 적어도 세 가지 주요 버전이 있으며 그 중 두 가지는 "컴퓨팅 기계 및 지능" 기사에서 제안되었으며 세 번째 버전은 Saul Traiger의 용어로 표준 해석입니다.

현대 해석이 튜링이 설명한 것과 일치하는지 아니면 그의 작업을 잘못 해석한 결과인지에 대한 논쟁이 있지만, 세 가지 버전은 동등한 것으로 간주되지 않으며 장점과 약점이 다릅니다.
이미테이션 게임

우리가 이미 알고 있듯이 Turing은 최소 3명의 플레이어가 참여하는 간단한 파티 게임을 설명했습니다. 플레이어 A는 남자이고, 플레이어 B는 여자이며, 대화 리더 역할을 하는 플레이어 C는 성별에 상관없습니다. 게임의 규칙에 따르면 C는 A나 B를 볼 수 없으며 오직 서면 메시지를 통해서만 소통할 수 있습니다. C는 선수 A와 B에게 질문을 함으로써 둘 중 누가 남자이고 누가 여자인지 알아내려고 합니다. 플레이어 A의 임무는 플레이어 C를 혼란시켜 잘못된 결론을 내리는 것입니다. 동시에 플레이어 B의 임무는 플레이어 C가 올바른 판단을 내릴 수 있도록 돕는 것입니다.

S. G. Steret이 Original Imitation Game Test라고 부르는 것에서 Turing은 컴퓨터가 플레이어 A의 역할을 수행할 것을 제안합니다. 따라서 컴퓨터의 임무는 플레이어 C를 혼란시키기 위해 여자인 척 하는 것입니다. 이러한 작업의 성공 여부는 플레이어 A가 컴퓨터일 때의 게임 결과와 플레이어 A가 남자일 때의 게임 결과를 비교하여 평가됩니다. Turing의 말에 따르면 "대화하는 플레이어가 남자와 여자 사이의 게임을 마친 후처럼 [컴퓨터를 사용한] 게임 후에 잘못된 결정을 내리는 경우가 많다"면 컴퓨터는 지능적이라고 말할 수 있습니다.

두 번째 옵션은 같은 기사에서 Turing이 제안했습니다. 초기 테스트와 마찬가지로 플레이어 A의 역할은 컴퓨터에서 수행됩니다. 차이점은 플레이어 B의 역할을 남성 또는 여성이 맡을 수 있다는 점입니다.

“특정 컴퓨터를 살펴보겠습니다. 이 컴퓨터를 충분한 저장 공간을 갖도록 수정하고 속도를 높이며 적절한 프로그램을 제공함으로써 시뮬레이션 게임에서 플레이어 A의 역할을 만족스럽게 수행하고 선수 B가 남자에 의해 연기된다고요?" - Turing, 1950, p. 442.

이 변형에서는 플레이어 A와 B 모두 리더가 잘못된 결정을 내리도록 설득하려고 합니다.

이 버전의 주요 아이디어는 튜링 테스트의 목적이 기계가 리더를 속일 수 있는지 여부에 대한 질문에 답하는 것이 아니라 기계가 사람을 모방할 수 있는지 여부에 대한 질문에 답하는 것입니다. Turing이 이 옵션을 의도했는지 여부에 대해 약간의 논쟁이 있지만 Sterrett은 Turing이 이 옵션을 의도하여 두 번째 옵션을 세 번째 옵션과 결합했다고 믿습니다. 동시에 Treyger를 포함한 반대자들은 그렇게 생각하지 않습니다. 그러나 이는 여전히 “표준 해석”이라고 부를 수 있는 결과로 이어졌습니다. 이 변형에서 플레이어 A는 컴퓨터이고 플레이어 B는 모든 성별의 사람입니다. 이제 발표자의 임무는 누가 남자이고 여자인지를 결정하는 것이 아니라, 누가 컴퓨터이고 누가 인간인지를 결정하는 것입니다.

2012년 튜링

2012년 튜링 탄생 100주년을 기념하는 행사를 조직하기 위해 특별위원회가 창설됐다. 이 위원회의 임무는 블레이드 러너 등 할리우드 영화에 반영된 지능형 기계에 대한 튜링의 메시지를 어린이를 포함한 일반 대중에게 전달하는 것이다. 위원회 구성원으로는 Kevin Warwick 의장, Huma Sha, 코디네이터, Ian Bland, Chris Chapman, Marc Allen, Rory Dunlop, Loebner Robbie Prize 수상자 Garne 및 Fred Roberts가 있습니다. 위원회는 Women in Technology와 Daden Ltd.의 지원을 받습니다.

편집자의 선택
칼로리 함량: 지정되지 않음 요리 시간: 지정되지 않음 우리 모두는 어린 시절의 맛을 좋아합니다. 어린 시절의 맛이 우리를 "아름답고 먼 곳"으로 데려가기 때문입니다....

통조림 옥수수는 정말 놀라운 맛을 가지고 있습니다. 그것의 도움으로 옥수수를 곁들인 배추 샐러드 요리법을 얻을 수 있습니다...

우리의 꿈은 때때로 특이한 인상을 남기고 그것이 무엇을 의미하는지에 대한 의문이 생깁니다. 해결해야 한다는 사실 때문에...

혹시 꿈에서 도움을 요청하셨나요? 마음 속으로는 자신의 능력이 의심스럽고 현명한 조언과 지원이 필요합니다. 또 왜 꿈을 꾸지...
커피 찌꺼기에 대한 운세는 인기가 많으며 컵 바닥에 운명의 표시와 치명적인 상징이 표시되어 흥미를 자아냅니다. 이런 예측으로...
나이가 어리다. 슬로우 쿠커에 당면을 곁들인 죽 요리를 준비하는 몇 가지 요리법을 설명하겠습니다. 먼저 살펴 보겠습니다.
와인은 모든 행사에서뿐만 아니라 더 강한 것을 원할 때도 마시는 음료입니다. 하지만 테이블 와인은...
이제 다양한 비즈니스 대출이 매우 커졌습니다. 기업가는 종종 진정으로 수익성 있는 대출을 찾을 수 있습니다...
원하는 경우 오븐에 계란을 넣은 미트 로프를 얇은 베이컨 조각으로 감쌀 수 있습니다. 그것은 접시에 놀라운 향기를 줄 것입니다. 그리고 계란 대신...