Wolfram Alpha - как это работает (часть 2)

Запущенная 18 мая долгосрочная цель вольфрам Альфа - инструмент поиска на естественном языке, который утверждает, что предлагает альтернативный подход к Google, - «сделать все систематические знания незамедлительными и доступными для всех».

Его создатели говорят: «Когда компьютеры были молодыми, люди предполагали, что смогут задать компьютеру любой фактический вопрос и рассчитать на него ответ». Я уверен, что они хотели бы добавить "и я рад это сказать"

Если цель Wolfram Alpha - создать такую ​​систему, то, похоже, это инструмент, о котором многие из нас мечтали.

В моем предыдущая статья Я попытался - как и многие - сказать кое-что о том, как система функционирует, и в этом - обзоре - я еще немного углублюсь в это и скажу вам, почему я немного разочарован - пока что с надеждой тоже.

В прошлый раз я предположил, что Wolfram Alpha работает, а) направляя ваш запрос с помощью лингвистического парсера, б) получая этот вывод и применяя дополнительные правила и манипуляции, и в) оценивая данные из глубокой сети, чтобы дать - мы надеемся - ответ.

Одна из самых сложных вещей в Wolfram Alpha - использовать его. То есть, получить ваш запрос "правильно"; или, по крайней мере, в форме, которую Wolfram Alpha может понять и использовать.

Понять и использовать

«Понять» означает, что лингвистический синтаксический анализатор (все части: синтаксический, семантический и т. Д.) Создал некоторый первоначальный «смысл» ваших слов; в то время как «использование» подразумевает, что это результирующее чувство может быть дополнительно понято и манипулировано для того, чтобы быть сопоставленным с источниками данных Wolfram Alpha.

Важный момент: чтобы получить успешный результат, вы должны понимать, что, хотя Wolfram Alpha может понравиться ваш запрос - иными словами, все критерии, кроме одного, были удовлетворены - он все еще может быть недостаточен для соответствующих данных. Однако это просто требует добавления более структурированных источников данных. Хотя стоит иметь в виду.

Получение успешного результата также означает, что вы совершенно не поняли функцию Wolfram Alpha. Wolfram Alpha - это не Google.

У Wolfram Alpha есть несколько полезных (но минимальных) рекомендаций, которые подчеркивают различия:

У Wolfram Alpha есть несколько полезных (но минимальных) рекомендаций, которые подчеркивают различия:

Если вы введете первые части этих примеров в Wolfram Alpha, вы в основном получите «правильные ответы», в то время как со вторыми битами вы не получите. Например, «самая высокая гора» не дает никакого результата. С Google, любая часть приводит к попаданиям, но это то, что вы ожидаете. Однако не ожидайте получить «правильные ответы» - на самом деле, удивитесь, если вы это сделаете.

Таким образом, одним из препятствий эффективного использования Wolfram Alpha является понимание того, как творить, и задать хороший вопрос.

Я могу придумать один простой способ улучшить обучение этому навыку. Дайте пользователям возможность оценить свои ответы Wolfram Alpha: «Да, это именно то, что я хотел»; "WTF!"; «О, нет - не то, что« Вольфрам Альфа не уверен, что делать с вашим вводом »снова!» Или, может быть, просто от 1 до 10 баллов.

Затем, в качестве учебного пособия, Wolfram Alpha мог отображать списки предыдущих запросов, которые получили высокие оценки - что может быть лучше, чем узнать, что раньше работало.

В любом случае, давайте посмотрим на реальную попытку использовать Wolfram Alpha; тот, где Wolfram Alpha выдает данные, которые, по крайней мере, имеют половинное значение.

Проблема, на которую я хотел ответить, состояла в том, чтобы бросить монетку несколько раз - но с поворотом в хвосте.

Итак, для начала я ввел «бросок монеты». Вольфрам Альфа вернулся с некоторыми базовыми вероятностями при подбрасывании монеты - например, вероятность увидеть 12 голов и восемь хвостов при 20 бросках.

Однако вопрос, на который я хотел ответить, был немного более сложным и касался подбрасывания монеты и наблюдения за последовательностью результатов. Вот вопрос:

В. Учитывая серию последовательных бросков монеты, более / менее вероятно, что я увижу последовательность HTT, прежде чем я увидела последовательность HTH - или это то же самое?

Просто чтобы перейти к погоне здесь; Ответ заключается в том, что среднее количество бросков, необходимых для просмотра HTH, равно 10, а для HTT - восемь (если вы мне не верите, попробуйте. Или просто напишите мне для объяснения).

Итак, после ввода этого прямо в Wolfram Alpha я получил то, что вы могли ожидать:

«Вольфрам Альфа не уверен, что делать с вашим вкладом».

И это довольно разумно, не так ли? Во-первых, я фактически набирал это вопросительное предложение примерно 10 раз, прежде чем был уверен, что прояснил проблему достаточно ясно, и все лингвисты знают, что я могу перефразировать этот вопрос бесконечное число раз, но все еще это имеет примерно такой же (или лучший) смысл. Таким образом, сообщение «WolframAlpha не знает, что делать с вашим вводом» может быть лингвистическим провалом «понимания».

Тем не менее, может быть, это было хорошо с этим - в конце концов, я дал ему немало: «монеты», «броски», «вероятно», «последовательность», «T», «H» - и Wolfram Alpha действительно знает некоторые вещи о подбрасывании монет.

Попробуйте, как я мог бы, я не мог получить больше по этой проблеме (так что вам придется попробовать это сами), и это может быть просто потому, что у Wolfram Alpha нет достаточно соответствующих данных, чтобы опираться на них. В качестве альтернативы, как я надеюсь, я уже ясно дал понять, что, возможно, он не сможет получить достаточно подсказок о том, что я спрашиваю из своего лингвистического анализа входных данных, или он не сможет принять адекватные подсказки, а затем манипулировать ими таким образом чтобы сделать запрос его источников данных работать любым способом жизнеспособным. Кто знает?

Возможно, еще одним улучшением будет то, что Wolfram Alpha расскажет вам больше о своем сообщении «Я не уверен»? В чем именно была проблема?

В конце концов, я пробормотал: «Да ладно, это всего лишь частный случай условной вероятности», и я обнаружил, что ввожу «условную вероятность».

В конце концов, я пробормотал: «Да ладно, это всего лишь частный случай условной вероятности», и я обнаружил, что ввожу «условную вероятность»

Кажется, мне придется подождать, и я думаю, что мне, скорее всего, придется подождать довольно долго, прежде чем я смогу что-то ввести в соответствие с моим вопросом и увидеть, что что-то подходящее вернется.

ОК, это был сложный вопрос. Я также признаю, что не признаю, что знаю все тонкости того, как взаимодействовать с Wolfram Alpha. Тем не менее, если Wolfram Alpha надеется стать движком вычислительных знаний на естественном языке, который, как я полагаю, является конечной целью, у нее есть довольно много пути - то есть, если вы не хотите знать, насколько высок Эверест с точки зрения Золотого Мосты ворот!

Пит Моррис изучал разработку программного обеспечения, компьютерную лингвистику и статистику в Оксфордском университете. В настоящее время он является научным сотрудником кафедры экспериментальной психологии и преподавателем статистики в колледже Св. Хильды.

Учитывая серию последовательных бросков монеты, более / менее вероятно, что я увижу последовательность HTT, прежде чем я увидела последовательность HTH - или это то же самое?
И это довольно разумно, не так ли?
Кто знает?
Возможно, еще одним улучшением будет то, что Wolfram Alpha расскажет вам больше о своем сообщении «Я не уверен»?
В чем именно была проблема?