Как научиться работать в такси


Советы начинающим таксистам - как устроиться работать в такси, избежав типичных ошибок начинающих

Работа в такси Яндекс привлекательна, но сама профессия таксист - это нечто более сложное, чем умение просто довезти пассажира до конечного пункта. Можно знать все правила, уметь разобрать-собрать машину с закрытыми глазами и абсолютно не уметь работать с человеком. От таксиста нужно умение взаимодействовать с каждым клиентом - и каждому угодить. Это та самая профессия, где стрессоустойчивость не просто банальное требование. Итак, вы решились пойти в такси. Чего ждать, с чего начать, чего опасаться?

 

С чего начать?

Первое, что надо решить для себя: готовы ли вы быть за рулем в качестве “извозчика”. У профессии много плюсов, и высокий заработок - один из них. Но и минусы тоже в этой работе есть. Твердое нет придется сказать профессии, если у вас серьезные проблемы со здоровьем - больной позвоночник, варикоз, сердечные проблемы, мигрени. В это случае вы не только рискуете усугубить свое состояние, но несете ответственность за безопасность своих пассажиров. Как знать, что здоровье не подведет на дороге в нужный момент.

Опыт вождения - нюанс номер два. Работа в таксопарке и “бомбить по вечерам” - разные вещи. Чтобы вас приняли на работу, недостаточно просто иметь свое авто и иметь водительский стаж. Хорошо, если есть опыт работы водителем. А еще плюс - ни одной аварии на счету. Конечно, врать, чтобы получить бонусный плюс перед работодателем, не нужно.

Состояние автомобиля - камень преткновения для многих водителей. В эконом-класс отечественный автомобиль с пробегом примут. Но если вы - владелец иномарки не старше трех лет, шансы быть принятым на работу повышаются.

 

Работа с клиентами

Хороший таксист просто довезет пассажира по адресу, а профессионал сделает поездку приятной и комфортной. Не зря считается, что Яндекс и Uber изменили отношение к таксистам. Теперь качество услуг отражается на рейтинге водителя. Чтобы получить себе бонусные баллы, сделайте так, чтобы пассажиру было комфортно в вашей машине: проветрите авто, не включайте навязчивую громкую музыку, не курите в салоне, вовремя мойте машину и салон.

Обзаведитесь регистратором - пусть он постоянно работает. Он поможет в спорных ситуациях на дороге, в ДТП, а иногда даже остановит буйного пассажира от необдуманного поступка.

Общение во время пути - еще один важный момент. Не только новичкам, но и опытным водителям важно знать, что навязчивость не играет на руку. Кто-то любит поговорить и охотно поддержит, а кто-то хочет просто доехать. С общительными эмоциональными клиентами общаться придется и поддерживать темы тоже. Хорошо, если это нейтральные рассказы о себе, погоде, работе. Но (!) ни в коем случает не затрагивайте темы политики, веры, национальности и прочие неудобные разговоры. Не провоцируйте на эмоции человека и сами не лезьте в это. Бывают разные ситуации, иногда клиент настолько вспыльчивый, что может рукоприкладствовать. Ведите себя вежливо, спокойно, сдержано.

Вообще вопрос безопасности стоит остро. В новостях не редкость сообщения об угонах, пострадавших таксистах, хулиганах. И пострадавшими становятся не только новички и частники. Чтобы обезопасить себя:

  • Не держите наличку на виду.
  • Не оставляйте машину открытой.
  • Не поддавайтесь на уговоры тех, кто просит подождать, пока он снимет деньги в банкомате, зайдет за ними в подъезд, разменяет купюры. Конечно, другое дело, если пассажир трезвый или оставляет в залог личную вещь или паспорт.
  • Уберите из салона авто подушки, игрушки, которые болтаются на лобовом стекле, ёлочки-ароматизаторы - они могут мешать в патовой ситуации.
  • Под спину установите жесткую основу, под голову и шею - высокий подголовник. Это делается для вашей безопасности.
  • Не тонируйте стекла, не пользуйтесь шторами для затенения салона. Пусть у вас будет хороший обзор: вы видите окружающих, окружающие - вас.

 

Вопросы заработка

На форумах, блогах, в соцсетях можно увидеть жалующихся таксистов: мол, работаешь-работаешь, а заработка не хватает на семью. Тут тоже есть свои хитрости.

Самая большая прибыль - в часы пик, в это время поездки оплачиваются по двойному тарифу. Кроме того, ночи, праздничные дни и плохая погода - шанс заработать больше. Делайте так, чтобы простои были минимальны. Берите заказ сразу после того, как подвезли клиента до места.

Выучите город на отлично - это прибавит плюс к рейтингу. Пользуйтесь не только навигатором, но и обычной картой, так как навигатор не всегда показывает маленькие улицы, переулки, особенно на окраине. Нелишним будет знать и пригород, расписание и маршруты общественного транспорта, режим работы кафе, клубов, ресторанов, хотя бы самых крупных.

Но запомните: как бы ни хотелось заработать больше, не жертвуйте полноценным отдыхом. Спать нужно не менее восьми часов в сутки, питаться нормально и не игнорировать состояние здоровья. Чувствуете, что засыпаете - сойдите с линии и отоспитесь. Дорога требует повышенной внимательности, не рискуйте собой и пассажирами.

 

Когда работать?

Условно сутки можно поделить на несколько временных зон:

  • 4:00 - 7:00. В это время нет пробок, почти нет конкурентов, но начинать работать в такое время сложно физически.
  • 7:00 - 10:00. Час пик в будние дни и “мертвое время” для выходных. Главный минус - пробки в сторону центра города.
  • 10:00 - 16:00. Утренних пробок нет, а заявок достаточно, чтобы не простаивать и не кататься вхолостую.
  • 16:00 - 19:00. Вечерний час пик, заказов много, но опять-таки - пробки, но уже со стороны центра. На выходных в это время обычно тоже хватает заказов, но уже появляются выпившие.
  • 19:00 - 22:00. Поток заявок чуть снижается, пробок на дорогах почти нет, конкуренция довольно высокая.
  • 22:00 - 1:00. Заявок особенно много на выходных, правда, среди них большинство - нетрезвые клиенты.
  • 1:00 - 4:00. Своеобразное затишье заказов, особенно в будние дни.

Для новичка лучше брать заказы утром и днем, а вот к ночной работе еще надо привыкнуть: разработать режим, продумать отдых, восстановление, питание до, во время и после смены.

Профессия таксиста требует большой самоотдачи и главное - желания работать с людьми. Погоня за заработком не принесет удовлетворения, потому перед тем, как принимать решение работать в такси, взвесьте все за и против.

Английский язык для водителей такси | Английский для работы

Эта страница из серии EnglishClub English for Work охватывает язык, который полезен водителям такси, говорящим на английском языке.

Примеры фраз

фраз, которые таксисты могут использовать с англоговорящими пассажирами.

Добро пожаловать

  • Привет / Привет
  • Доброе утро
  • Добрый день
  • Добрый вечер
  • Как ты сегодня?
  • Привет. Могу взять 4 пассажиров .

Назначение

  • Куда я могу вас отвезти?
  • Куда ты идешь?
  • Какой у вас пункт назначения ?
  • Я не знаю это место. У вас есть карта ?
  • Можете показать мне на этой карте?
  • Ты торопишься ?
  • Это очень близко.
  • Это довольно далеко.
  • Это займет около 15 минут.
  • Дорога займет около часа.
  • Быстрее ехать по скоростной автомагистрали , но за проезд придется платить.

Понимание пассажира

  • Говори медленно, пожалуйста.
  • Извините, я не понимаю.
  • Да, я понимаю. Я отвезу тебя туда.
  • Попросите кого-нибудь написать это на тайском / китайском / и т. Д.
  • Нет проблем.

Особые указания / запросы

  • Я положу ваш багаж в багажник / багажник .
  • Пристегните, пожалуйста, ремень безопасности .
  • Можно, если я открою окно?
  • Кондиционер в порядке?
  • Пожалуйста, не ешьте в машине.
  • Не курить, пожалуйста.
  • Вы хотите, чтобы я подождал?
  • Мне нужно немного бензина.

Условия движения

  • Это час пик .
  • Пробка .
  • Движение там плохое. Вы доберетесь туда быстрее, если пойдете отсюда пешком.
  • Кажется, произошла авария .
  • Попробую по другому.

Тарифы и сборы

  • Общая стоимость 10 долларов.
  • Спасибо за подсказку.
  • У вас есть купюры меньшего размера, / купюры ?
  • У меня нет сдачи .
  • Клиент платит за автомагистраль, хорошо?
  • Торопитесь? Съехать по скоростной автомагистрали ?
  • Есть плата за проезд . Вы платите, хорошо?

До свидания

  • Остерегайтесь мотоциклов перед выходом!
  • Не забывай свои вещи.
  • Спасибо за ваш бизнес.
  • Надеюсь увидеть вас снова.
  • Было приятно с вами поболтать.
  • Наслаждайтесь пребыванием в Таиланде / Китае / и т. Д.
  • Пожалуйста.

Нет обслуживания

  • Извините, это выходит за рамки моих .
  • Я не могу туда пойти. Мне бы пришлось вернуться без тарифа .
  • Извините, я не хожу в аэропорт.
  • На день / ночь все готово.
  • Я должен вернуть машину вовремя.
  • Моя машина нуждается в ремонте.
  • Мне очень жаль. Хорошего дня.
  • Я могу вызвать для вас другого водителя / компанию.

Светский разговор

  • Вы бывали здесь раньше?
  • Вы откуда-то отсюда?
  • Как вам Бангкок / Пекин и т. Д.?
  • Вы здесь по делу?
  • Вы надолго остаетесь?
  • Хорошая погода, а? Не слишком жарко, не слишком холодно.
  • Надеюсь, погода улучшится.

Что может сказать пассажир

  • Можно меня подвезти?
  • Сколько человек вы можете вместить?
  • Сколько времени это займет?
  • Подождите меня.
  • Вы можете держать счетчик в рабочем состоянии.
  • У вас есть фиксированный сбор до аэропорта?
  • Я немного спешу с .
  • Можем ли мы приехать к 10 часам / полдень / 16:00 / и т. Д.?
  • Не могли бы вы притормозить?
  • Это самый быстрый способ?
  • Вы принимаете кредитные карты?
  • У вас есть сдача?
  • Оставьте сдачу себе.
  • Спасибо за поездку / подъем.

пассажир : человек, путешествующий в машине, автобусе, поезде (не водитель)

пункт назначения : место, куда вы хотите отправиться

карта : схема или изображение улиц и дорог

в спешке : помчались; нужно идти быстро

скоростная / автомагистраль : скоростная дорога

платная дорога : скоростная дорога с платой

звонок : платно; комиссия

Багажник / багажник : ящик в задней части автомобиля для багажа, чемоданов и т. Д.

ремень безопасности : ремень для удержания кого-либо на сиденье в автомобиле или самолете

авария : авария; автомобиль сбивает другую машину или человека

комиссия : цена; заряд

банкнота / банкнота : бумажные деньги

границы : пределы

тариф : стоимость такси; пассажир

фиксированная ставка : фиксированная цена

в спешке : в спешке; поздно; хочу идти быстро

Пример разговора

Прочтите этот разговор таксиста и пассажира.Затем сделайте тест, чтобы проверить свое понимание.

Водитель такси : Привет. Куда ты собираешься?

Пассажир : Пожалуйста, на вокзал.

Водитель такси : Положить вашу сумку в багажник?

Пассажир : Нет, спасибо. Я сохраню это при себе. Сколько времени до станции?

Таксист : около 30 минут. Вы спешите?

Пассажир : Да, я немного опоздал.

Таксист : Можем ехать по скоростной дороге. Есть дополнительная плата, хорошо?

Пассажир : Ничего страшного, спасибо.

Таксист : Пристегните, пожалуйста, ремень безопасности.

Пассажир : Хорошо.

Таксист : Скоростная автомагистраль. Могу я получить 3 доллара за гонорар?

Пассажир : Вот, пожалуйста.

Таксист : Вы едете на поезд на вокзале?

Пассажир : Да, я собираюсь на пляж встретиться с друзьями.

Водитель такси : Хорошо. Вот станция.

Пассажир : Спасибо. Сколько это стоит?

Таксист : 55 долларов.

Пассажир : Вот 60 долларов. Сдачи не надо.

Водитель такси : Спасибо. Не забывай свои вещи.

Пассажир : Хорошо. До свидания. Хорошего дня!

,

Вы должны поговорить с водителем такси на английском языке!

. .
Райан: На ​​этом уроке вы научитесь разговаривать с водителем такси.
Тихиро: Итак, этот разговор происходит внутри такси.
Райан: Разговор между Дрю и водителем.
Тихиро: Они оба будут говорить небрежно. Ладно, давай послушаем разговор.

Урок разговорной

Дрю: Такси! (открывает дверь, входит, закрывает дверь)
Таксист: Куда?
Дрю: Вы можете отвезти меня в отель «Золотые ворота»? У меня есть адрес прямо здесь.
Таксист: Не волнуйтесь, я знаю, где это.
Дрю: О, хорошо.
Водитель такси: Вы слышали, что случилось с картиной Энди Уорхола в MOMA? Он был украден!
Дрю: Правда? Вот Это Да! Это просто безумие! Охрана, должно быть, спала, или вор, должно быть, был шустрым! Как в фильмах!
Таксист: Да, наверное, какой-нибудь любитель искусства, достаточно спортивный, чтобы проделать такой трюк.
Дрю: Ага, а может, человек просто не подумал, что это достаточно современно, чтобы находиться в Музее современного искусства…
Таксист: Мы здесь. Это будет 44 доллара.90.
Дрю: О, вот пятьдесят долларов. Сдачи не надо. Спасибо.
Таксист: Хорошо. Хорошего дня.
Райан: Давайте послушаем разговор медленно.
Дрю: Такси! (открывает дверь, входит, закрывает дверь)
Таксист: Куда?
Дрю: Вы можете отвезти меня в отель «Золотые ворота»? У меня есть адрес прямо здесь.
Таксист: Не волнуйтесь, я знаю, где это.
Дрю: О, хорошо.
Водитель такси: Вы слышали, что случилось с картиной Энди Уорхола в MOMA? Он был украден!
Дрю: Правда? Вот Это Да! Это просто безумие! Охрана, должно быть, спала, или вор, должно быть, был шустрым! Как в фильмах!
Таксист: Да, наверное, какой-нибудь любитель искусства, достаточно спортивный, чтобы проделать такой трюк.
Дрю: Ага, а может, человек просто не подумал, что это достаточно современно, чтобы находиться в Музее современного искусства…
Таксист: Мы здесь. Это будет 44 доллара.90.
Дрю: О, вот пятьдесят долларов. Сдачи не надо. Спасибо.
Таксист: Хорошо. Хорошего дня.
БАНТЕР ПОСЛЕ РАЗГОВОРА
Тихиро: Хорошо, теперь для тех из вас, кто находится в странах, где вы можете ехать впереди такси, в Штатах вы обычно едете сзади.
Райан: Если сзади полно пассажиров, вы можете ездить спереди, но обычно вам нужно сидеть сзади.
Тихиро: Верно, это для безопасности водителя и вас самих.Кроме того, такси в штатах не будут брать более одной группы одновременно, поэтому вам не нужно беспокоиться о том, что они остановятся, чтобы забрать дополнительных пассажиров.
Райан: Я знаю место, где это делают, на самом деле, сэкономить бензин - хорошая идея!
Тихиро: Ммм я согласен с вами.Но вы знаете, что; Я действительно не вижу, чтобы это происходило в Штатах.
Райан: Да, я тоже. Также хорошо дать водителю чаевые при выходе из такси, обычно около пятнадцати процентов на большие расстояния и 2-3 доллара на короткие расстояния. Но не беспокойтесь, если вы дадите им чаевые где-то посередине. Если водитель поможет вам с багажом, то чаевые должны быть немного больше.
Тихиро: Хорошее замечание, но если они недружелюбны, вы можете им меньше давать чаевые. Также не забывайте давать чаевые не монетами, а только купюрами. Вы, конечно, можете дать им больше суммы и сказать им «оставить сдачу», и это будут ваши чаевые.
Райан: Так как водители не всегда знают местонахождение мест, лучше, если вы готовы указать направление или у вас будет под рукой карта.
Тихиро: И не забудьте высказаться. Вы не хотите попасть в совершенно другое место.
Райан: Нет, это было бы ужасно. Ладно, думаю, советов хватит.
СПИСОК VOCAB
Райан: Давайте посмотрим на словарь этого урока.
: Первое слово, которое мы увидим:
Тихиро: Куда? [естественная собственная скорость]
Райан: неформальный способ спросить, куда кто-то хотел бы пойти
Тихиро: Куда? [медленно - по слогам]
Тихиро: Куда? [естественная собственная скорость]
: Следующая:
Тихиро: слышишь? [естественная собственная скорость]
Райан: неформальный способ спросить, слышал ли кто-нибудь какую-либо информацию
Тихиро: слышишь? [медленно - по слогам]
Тихиро: слышишь? [естественная собственная скорость]
: Следующая:
Тихиро: МОМА [естественная скорость]
Райан: Акроним от Museum of Modern Art
Тихиро: МОМА [медленно - по слогам]
Тихиро: МОМА [естественная скорость]
: Следующая:
Тихиро: маневренный [естественная скорость]
Райан: передвигается легко и быстро
Тихиро: проворный [медленно - по слогам]
Тихиро: маневренный [естественная скорость]
: Следующая:
Тихиро: атлетичный [естественная скорость]
Райан: спортивные навыки
Тихиро: атлетичный [медленно - по слогам]
Тихиро: атлетичный [естественная скорость]
: Следующая:
Тихиро: трюк [естественная скорость]
Райан: сложный и опасный экшн
Тихиро: трюк [медленно - по слогам]
Тихиро: трюк [естественная скорость]
: Следующая:
Тихиро: изменить [естественную скорость]
Райан: деньги возвращаются, когда платеж превышает причитающуюся сумму
Тихиро: изменить [медленно - по слогам]
Тихиро: изменить [естественную скорость]
: Следующая:
Тихиро: сохраните изменения [естественная собственная скорость]
Райан: выражение, чтобы оставить лишние деньги в качестве чаевых
Тихиро: оставь сдачу [медленно - по слогам]
Тихиро: сохраните изменения [естественная собственная скорость]
КЛЮЧЕВАЯ СЛОВА И ФРАЗЫ
Райан: Давайте подробнее рассмотрим использование некоторых слов и фраз из этого урока.
Тихиро: Первое слово / фраза, которую мы рассмотрим, это ...
Райан: Давайте подробнее рассмотрим использование некоторых слов и фраз из этого урока.Первая фраза, которую мы рассмотрим, -
Тихиро: "... как угодно".
Райан: Мы используем эту фразу после прилагательного, чтобы подчеркнуть значение прилагательного.В диалоге
Тихиро: «Шустрый как все»
Райан: Значит, человек был очень и очень шустрым. Вор в этой истории смог украсть известную картину из художественной галереи, поэтому он должен быть очень быстрым и спортивным.
Тихиро: Мы также можем использовать это выражение с другими прилагательными. Например,
Райан: «Она такая же умная, как и все остальное».
Тихиро: Конечно, это означает, что она очень, очень умна.Другой пример:
Райан: «Он силен как никто другой»,
Тихиро: это означает, что он очень и очень силен.
Райан: Вторая фраза, которую мы рассмотрим, это "... тянуть "как в
Тихиро: «тянуть трюк».
Райан: В диалоге это означает совершить ограбление. Это жаргонный термин, и мы используем его вместо
Тихиро: «совершить преступление.«
Райан: Хорошо, а что мы будем вытаскивать дальше?
Тихиро: Давайте вытащим грамматический пункт для этого урока.

Фокус урока

Райан: Хорошо, в центре внимания этого урока модальное «обязательное».«
Тихиро: «Должен» - это модальный глагол, который является вспомогательным или вспомогательным глаголом. Мы используем его перед другими глаголами, чтобы сказать, что что-то абсолютно согласно говорящему. Он стоит перед другим глаголом. Пример предложения:
Райан: "Охрана, должно быть, спала.«
Тихиро: Дрю заключает, что безопасность спала.
Райан: "охрана должна спать"
Тихиро: Неправильно.Вы не можете использовать это модальное окно только с обычным прошлым. Хорошо, вот еще одно предложение из диалога.
Райан: "Вор, должно быть, был шустрым!"
Тихиро: Опять же Дрю говорит, что он убежден, что вор был шустрым.Обратите внимание, что слово «должен» - личное мнение оратора.
Райан: Хорошо, эти два примера из диалога говорят о чем-то из прошлого. Уверенность в прошлом. Как вы думаете, что произойдет, когда о чем-то будут говорить в настоящем?
Тихиро: Это хороший вопрос, который поднял Райан.Возьмем, к примеру, предложение типа
Райан: «Он должен знать об этом».
Тихиро: А,
Райан: «Он должен закончить отчет.”
Тихиро: В этих двух примерах используется настоящее время. Тем не менее, первый говорит о том, что Райан уверен в текущем состоянии, а второй говорит о том, что необходимо сделать в будущем.
Райан: Верно, поэтому иногда, употребляя слово «должен» в настоящем, можно говорить о чем-то в настоящем или о чем-то в будущем.Вот еще один пример. Если Тихиро скажет ...
Тихиро: «Он, должно быть, проснулся».
Райан: Она заявляет, что уверена, что парень сейчас проснулся. Но если она скажет что-то вроде
Тихиро: «Он должен вздремнуть».
Райан: Это означает, что он должен немного поспать в ближайшем будущем.
Тихиро: Право так что у вас есть. В любом случае, использовалось ли оно для вещей в прошлом или в нынешней форме, «must» означает личное мнение.
Райан: Личное мнение о чем-то определенном для каждого человека.
Тихиро: Хорошо я думаю, что на сегодня достаточно объяснений.Теперь мы должны закрыть грамматический вопрос.
Райан: Согласен.

Outro

Райан: Вот и все на сегодня.
Тихиро: Готовы ли вы проверить то, что вы только что узнали?
Райан: Пополните словарный запас этого урока, используя в учебном центре карточки для конкретных уроков.
Тихиро: Есть причина, по которой все используют карточки; они действительно работают!
Райан: Они действительно помогают запоминанию. Вы можете получить карточки для этого урока на Englishclass101.ком. Ладно, пока пока!
Тихиро: До скорой встречи!
.

Обучение с подкреплением: давайте научим такси водить | Валентина Альто

Обучение с подкреплением - это подраздел машинного обучения, задачи которого отличаются от «стандартных» способов обучения. В самом деле, вместо того, чтобы получать исторические данные и делать на их основе прогнозы или заключения, вы хотите, чтобы ваш алгоритм подкрепления учился с нуля из окружающей среды. По сути, вы хотите, чтобы он вел себя так же, как и в аналогичной ситуации (если вы хотите узнать больше о структуре RL, щелкните здесь, чтобы прочитать мою предыдущую статью).

В этой статье я покажу вам, как реализовать решение RL с использованием Python и его библиотеки gym-OpenAI, которую вы можете легко установить, запустив на консоли Jupyter pip install gym . Проблема, которую я собираюсь представить вам, заключается в следующем:

Ваша среда состоит из матрицы 5x5, где каждая ячейка - это позиция, на которой может оставаться ваше такси. Затем у вас есть 4 координаты, которые представляют точки посадки и высадки, а именно (0,0), (0,4), (4,0), (4,3) (для согласованности с Python язык, первый индекс равен 0, а не 1).Мы будем называть их R, G, Y, B и индексировать их местоположение соответственно 0,1,2,3. Наконец, есть один пассажир, которого можно либо поднять, либо высадить, а также перевозить (следовательно, проводить время в кабине). В частности, этот пассажир хочет добраться до точки B.

Теперь, если мы импортируем наш модуль gym и инициализируем среду такси, мы увидим, что он повторяет то, что мы говорили до сих пор:

 import gym 
env = gym .make ( "Taxi-v2").env
env.render ()

Как видите, у нас есть пространство 5x5 с нашими 4 местоположениями, где синяя буква представляет местоположение текущего пассажира, а фиолетовая буква - место высадки. У нас также есть наше такси / агент в этом пространстве, которое представляет собой желтый прямоугольник, а также некоторые стены, представленные символом «|».

Теперь есть два элемента, которые требуют нашего внимания: состояния и действия.

Давайте сначала рассмотрим наши действия. Согласно импортированному модулю, агент может действовать 6 способами:

  • 0: спускаться (юг)
  • 1: подниматься (север)
  • 2: идти направо (восток)
  • 3: идти налево (запад) )
  • 4: забрать
  • 5: отпустить

Во-вторых, сколько у нас состояний? Ну, по крайней мере, 25: действительно, имея пространство 5x5, мы знаем, что кабина может просто занимать эти ячейки.Кроме того, такси также может находиться в состоянии посадки или высадки пассажира (независимо от того, находится ли оно на самом деле: помните, что такси будет двигаться по попыткам), следовательно, у нас есть еще 4 состояния. Наконец, мы должны вычислить те состояния, в которых пассажира действительно подобрали, высадили (+4 состояния, так как мест, где может находиться пассажир, равно 4) или просто перевезти (+ 1 состояние). Итак, всего у нас 5x5x4x5 = 500 состояний.

Каждое состояние нашего агента, которое представлено вектором значений [строка такси, столбец такси, индекс пассажира, индекс пункта назначения] , соответственно кодируется значением от 0 до 499.А именно, мы можем воспроизвести местоположение нашего предыдущего изображения следующим образом:

 state = env.encode (4, 2, 3, 2) 
print ("State:", state) env.s = state
env.render ( )

Как вы можете видеть, зная, что наше такси находится в позиции (4,2), а индекс пассажира = 3 и место высадки = 2, мы можем вывести, что закодированное состояние - 454. Для следующего эксперимента мы будет использовать эту отправную точку, но прежде чем углубиться в нее, нам нужно ввести последний элемент: систему вознаграждения.

Система вознаграждения - это основная идея обучения с подкреплением: агент вознаграждается каждый раз, когда он действует хорошо, в противном случае он «наказывается» отрицательным вознаграждением. В этом конкретном случае встроенная таблица вознаграждения P создается сразу после создания env. Логика следующая:

  • если такси правильно принимает / высадку пассажира, оно награждается +20 баллов
  • , если такси делает незаконную посадку / высадку, оно наказывается -10 баллов
  • для каждого шага, который не включает состояния выше, он теряет 1 балл

Итак, давайте посмотрим, как это выглядит для нашего состояния 454:

 env.P [454] 

Первое, на что следует обратить внимание, это то, что каждая запись нашей таблицы P представляет собой словарь со структурой {action: [(вероятность, следующее состояние, вознаграждение, выполнено)]}

  • Action: it колеблется от 0 до 5
  • Вероятность: в этом случае всегда 1
  • Следующее состояние: это состояние, которое происходит, если это действие выполнено
  • награда: награда / штраф, связанный с этим действием
  • выполнено: если Правда, значит, серия окончена, а иначе нет.

Давайте попробуем прочитать наш результат: первая строка говорит нам, что если мы спустимся (действие 0 = юг), мы останемся в том же положении, так как у нас есть граница, следовательно, награда будет -1, а эпизод не окончен; вторая строка, соответствующая action = north, приведет наше такси к позиции 354, но награда всегда -1, и эпизод не закончен. Рассуждения одинаковы для всех действий. Обратите внимание, что если действие происходит подъём или высадкой такси, поскольку такси находится не в правильных местах (R, Y, G, B), как в последних двух строках (соответствующих действиям 4 и 5), оно получает штраф в размере -10.

Пришло время обучить наш алгоритм. Алгоритм, который мы собираемся использовать, называется Q-обучением. Я уже объяснил идею, лежащую в основе этой статьи, поэтому здесь я не буду углубляться.

Процедура поясняется следующим кодом:

 import random # установка yperparameters 
lr = 0.1 # скорость обучения
gamma = 0.6 #discount factor
epsilon = 0.1 # компромисс между разведкой и разработкой для i в диапазоне (1, 1000): # мы увидим 1000 серий
state = env.reset () # давайте сбросим наши envepochs, штрафы, награды, = 0, 0, 0
done = False

while not done:
if random.uniform (0, 1) action = env.action_space.sample ( ) # исследуйте область действия
else:
action = np.argmax (q_table [state]) # используйте изученные значения

next_state, reward, done, info = env.step (action)

old_value = q_table [state, action]
next_max = np.max (q_table [next_state])

new_value = (1 - alpha) * old_value + lr * (reward + gamma * next_max)
q_table [state, action] = new_value

if reward == -10:
штрафов + = 1state = next_state
epochs + = 1

Теперь представьте, что вы должны решить, какое действие максимизирует вашу полезность (в переводе, что ведет к наилучшему возможному направлению к вашему пассажиру в позиции 3).Ваш ответ, вероятно, будет север, отсюда действие 1: действительно, это будет самый быстрый способ добраться до места (4,3), где находится ваш пассажир. Что скажет наш алгоритм?

 np.argmax (q_table [454]) #argmax функция возвращает позицию 
#maximum значения среди тех, что в исследуемом векторе

1

Как вы можете видеть, функция argmax возвращает позицию 1, которая соответствует к действию «север». Таким образом, для каждой позиции наша q-таблица сообщит нам, какое действие максимизирует текущие и будущие вознаграждения.

.

Смотрите также