Как научиться решать задачи по экономике


Учимся решать экономические задачи — Студопедия

Типы задач:

· Анализ функции кривой производственных возможностей и её графическое обоснование;

· Построение кривых производственных возможностей на основании различных данных об альтернативных возможностях производителей.

· Расчёт альтернативных издержек.

· Применение закона возрастающих альтернативных издержек.

1.1. На машиностроительном предприятии в одном из цехов можно произвести 1000 двигателей или 500 агрегатов, а в другом альтернативная стоимость производства 2 агрегатов равна 8 двигателям при максимально возможном производстве двигателей равном 1600 единицам.

Постройте общую кривую производственных возможностей машиностроительного предприятия и заштрихуйте плоскость каждого цеха.

Решение:

Рассчитаем максимально возможное производство двигателей (Д.) и агрегатов (А.) в двух цехах. Если максимально возможное производство двигателей во втором цехе составляет 1600 единиц, а при этом альтернативная стоимость производства 2 А. равна 8 Д., то в данном цехе, при имеющихся ограниченных ресурсах, можно произвести 400 агрегатов. Тогда в обоих цехах можно произвести либо 2600 двигателей (1600 Д. + 1000 Д.), либо 900 агрегатов. (500 А. + 400 А.).

Приступим к построению общей КПВ машиностроительного предприятия, при условии, что в данном году руководство предприятия решило произвести только двигатели. По оси абсцисс отложим максимально возможное производство двигателей в двух цехах (2600 Д.), а по оси ординат максимально возможное производство агрегатов (900 А.).


Построение КПВ начнём со второго цеха, т.к. в данном цехе потери в виде недополученных агрегатов минимальные(альтернативная стоимость 1 Д. = ¼ А.). Линия производственных возможностей второго цеха будет соединять точку максимального производства агрегатов на предприятии (0 Д.; 900 А.) с проекцией точки наибольшего производства двигателей в данном цехе (1600 Д.; 500 А.). При таком выборе предприятие, отдавая предпочтение производству двигателей, отказалось от возможного производства агрегатов в размере 400 единиц (900 А. – 400 А.). Данная прямая линия есть частный случай общей выпуклой кривой производственных возможностей предприятия.

Точка с координатами (1600 Д.; 500 А.) – это точка перегиба КПВ.

КПВ первого цеха строится аналогично. Увеличив производство двигателей на величину возможного производства (1000 единиц), мы попадём в точку с координатами (2600 Д.; 0 А.) В данном выпуске продукции машиностроительное предприятие не сможет произвести 500 агрегатов. Линия, соединяющая точку (2600 Д.; 0 А.) с точкой перегиба, будет частным случаем кривой производственных возможностей первого цеха.


Ответ:

Заштрихованные области – цеха машиностроительного предприятия.

1.2. Могут ли следующие точки лежать на одной кривой производственных возможностей: А (18; 0), В (11; 16), С (16; 9), Е(8;15), М (7; 16), Р (0; 21)? Обоснуйте свое решение, не прибегая к построению графика КПВ.

Решение:

Применим закон возрастающих альтернативных издержек. Расположим заданные точки по возрастанию одной из координат (например, координаты Х): Р (0; 21), М (7; 16), Е (8; 15), В (11; 16), С (16; 9), А(18; 0). Если данные точки принадлежат одной КПВ, то значения чисел по другой координате (например, Y) должны убывать. Однако точка В с координатами (11; 16) не отвечает главному требованию нашего условия.

Ответ:

Точки А, В, С, Е, М и Р не могут принадлежать одной кривой производственных возможностей, т.к. нарушен закон возрастающих альтернативных издержек.

1.3. Ниже приведена кривая производственных возможностей машиностроительного предприятия, которое производит двигатели и агрегаты (в единицах).

Охарактеризуйте производственные возможности предприятия при условии, что в данном году оно будет производить только двигатели. Ответьте на следующие вопросы:

А) Сколько у предприятия производственных участков и чему равны альтернативные возможности производства на них?

Б) Чему равна альтернативная стоимость производства ещё одного двигателя, если их производится 60 единиц? Вычислите максимально возможное производство агрегатов.

Решение:

А) На предприятии три участка с максимально возможным производством или 350 двигателей (Д.), или 190 агрегатов (А.).

На верхнем участке производственные возможности предприятия позволяют произвести или 100 Д., или 40 А. (190 А. – 150 А.). Альтернативная стоимость производства 1 Д. = 0,4 А..

На среднем участке можно будет произвести или 100 Д. (200 Д. - 100 Д.) или 50 А. (150 А. – 100 А.). Альтернативная стоимость производства 1 Д. равна 0,5 А..

На нижнем участке возможное производство составит или 150 Д. (350 Д. – 200 Д.) или 100 А. (100 А. – 0 А.) с альтернативной стоимостью производства 1 Д. = 0,7 А.

Если предположить, что в этом году на предприятии решили производить только двигатели, то процесс производства начнут с того участка, на котором потери в виде недополученных агрегатов будут минимальными, т.е. там, где альтернативная стоимость двигателей наименьшая. Следовательно, эффективное производство двигателей можно достичь на верхнем участке, где производство каждой его дополнительной единицы предполагает потерю ресурсов, предназначаемых на производство 0,4 агрегатов.

Б) Если двигателей производится 60 единиц, то это означает, что рациональный производитель будет работать на верхнем участке, т.к. на данном участке альтернативная стоимость каждой дополнительной единицы двигателя наименьшая (0,4 А.). При этом производство 60 двигателей приведёт к тому, что производитель должен будет отказаться от выпуска 24 агрегатов (60 Д. × 0,4). Увеличив производство двигателей ещё на одну единицу, производитель уже теряет 24,4 А. от максимально возможного производства. Следовательно, максимально возможное производство агрегатов, при условии, что производитель будет производить только 61 Д., составит 165,6 А. (190 А. - 61 т × 0,4).

1.4. Дана кривая производственных возможностей фермера на трех полях.

Предположим, что он решил под выращивание 130 тонн картофеля отвести нижнее поле, а два других поля не трогать. Используя графическое изображение КПВ фермера, оцените его выбор. Вычислите максимально возможное производство пшеницы, если картофеля будет произведено 130 тонн.

Решение:

В плоскости нижнего поля производство каждой тонны картофеля предполагает, что потери пшеницы на нем будут составлять ⅔ тонны от возможного выпуска. Тогда, при производстве 130 тонн картофеля, возможные потери пшеницы составят 86,6 т (130 т К. × ⅔). Отсюда следует, что максимально возможное производство пшеницы фермером будет 103,4 т (190 т П. – 86,6 т П.).

Однако следует заметить, что данный выбор фермера является не эффективным. Согласно теории КПВ эффективным считается выбор, при которомпотери в виде недополученной продукции минимальны. Следовательно, фермер под выращивание 130 т К. должен отвести верхнее поле полностью и часть среднего. На данных полях потери в виде недополученной пшеницы будут минимальными (каждая тонна картофеля предполагает отказ от производства 0,4 или 0,5 тонн пшеницы соответственно). Отсюда альтернатива отказа по полям составит 55 т пшеницы (40 т П. + 30 т П. × 0,5). Тогда максимально возможное производство пшеницы фермером, при условии, что он будет производить 130 т К., составит 135 т (190 т П. – 55 т П.).

Ответ:

Эффективное производство 130 тонн картофеля возможно при возделывании верхнего поля полностью и части среднего. Потери в виде недополученной пшеницы на них будут минимальными (55 т против 86,6 т). Максимально возможное производство пшеницы составит 135 т против 103,4 т.

1.5. На одном поле фермер может произвести 1000 т картофеля или 400 т пшеницы, а на другом, альтернативная стоимость выращивания 2 т пшеницы равна 6 т картофеля при максимальном производстве картофеля равном 1500 т.

А) Постройте общую кривую производственных возможностей фермера на двух полях при условии, что фермер решил выращивать картофель. Заштрихуйте поля.

Б) Допустим, фермер всегда засевал все поля картошкой, но на этот год ему потребовалось произвести только 200 т пшеницы. На каком поле её посадить? Каково при этом максимально возможное производство картофеля (в тоннах)?

Решение:

А) Построим КПВ:

· (2500 т К.; 0 т П.) и (0 т К.; 900 т П.) – координаты максимально возможного производства картофеля и пшеницы фермером на двух полях;

· (1500 т К.; 400 т П.) – координаты точки перегиба КПВ.

· 1 т К. = 0,3 т П. – альтернативные возможности производства на верхнем поле;

· 1 т К. = 0,4 т П. – альтернативные возможности производства на нижнем поле.

Б) Если исходить из того, что на этот год фермеру потребовалось произвести только 200 т пшеницы, то ему выгоднее всего ее посадить на том поле, где потери в виде недополученного картофеля будут минимальными, т.е. там, где альтернативная стоимость пшеницы наименьшая. В силу того что на нижнем поле альтернативная стоимость 1 т П. = 2,5 т К., а на верхнем 1 т П. = 3 т К., то фермеру выгоднее произвести 200 тонн пшеницы на том поле, где каждая тонна пшеницы предполагает отказ от производства 2,5 тонн картофеля, т.е. на нижнем.

При производстве только 200 т пшеницы потери в виде недополученного картофеля составят 500 тонн (2500 т К. – 200 т П. ×2,5). Отсюда максимально возможное производство картофеля будет 2000 тонн.

Использование документированного решения проблем в экономике


Область экономики требует от студентов использования навыков критического мышления и решения проблем, но, к сожалению, у многих студентов не было возможности развить такие навыки до поступления в класс экономики. Таким образом, они находят экономику пугающей. Это прискорбно, но это веские аргументы в пользу того, почему задокументированное решение проблем так хорошо подходит для курсов экономики. Документированное решение проблем предоставляет студентам основу, в которой они могут начать изучать свои стратегии решения проблем.

Документированное решение проблем эффективно использовалось в курсах «Принципы экономики» в большом государственном исследовательском учреждении в течение последних нескольких лет. Он использовался с темами производственных возможностей, предложения и спроса, эластичности цен и потребительского спроса, рыночных структур, рынка труда, безработицы, фискальной и денежно-кредитной политики, ВВП на душу населения и экономического роста, эффективных налоговых ставок, международной торговли и многого другого. . Понятно, что его можно применить практически к любому курсу экономики.Студенты сначала находят этот процесс сложным, но, поскольку сам процесс не оценивается, они вскоре расслабляются и наслаждаются им как инструментом, который служит для улучшения их учебного процесса.

Документированное решение проблем способствует развитию критического мышления и навыков решения проблем

Анджело и Кросс (1993, стр. 222) пишут: «Чтобы стать действительно опытными в решении проблем, учащиеся должны научиться делать больше, чем просто получать правильные ответы на задачи из учебников. В какой-то момент им нужно узнать, как они решали эти задачи. проблемы и как они могут адаптировать свои процедуры решения проблем для решения беспорядочных, реальных проблем.. . Понимание и использование эффективных процедур решения проблем, в конце концов, является важным компонентом мастерства в большинстве дисциплин ». Документированное решение проблем требует от учащихся размышлений о том, как они решают задачу , а затем записать шаги, которые они используют.

Когда учащиеся описывают, как они разбивают экономическую проблему на небольшие основные шаги, они часто пишут:
  • Сначала я рассмотрел определение ...
  • Я открыл свои заметки в разделе о ...
  • Первое, о чем подумала моя группа...
  • Я вспомнил нарисованный вами график и ...
  • В указании указано, где находится ...
  • По формуле ...
  • Я прочитал вопрос, а затем перечитал его снова ...

Таким образом, задокументированное решение проблем обеспечивает окно, через которое преподаватель может видеть мыслительные процессы учащихся. Инструкторам приятно видеть, как студенты становятся более целеустремленными и осознанными в своем подходе к решению проблем, и даже вырабатывают шаблоны решения проблем, которые можно перенести в другие области экономики и другие области обучения.Благодаря использованию задокументированного решения проблем учащиеся становятся более эффективными учениками; более опытны в своем мыслительном процессе.

Документированное решение проблем - типы вопросов

Задокументированное решение проблем хорошо работает с вопросами с множественным выбором, верными / неверными и короткими ответами. Вопросы из банков тестов обычно работают и всегда доступны. В качестве альтернативы преподаватели могут написать свои собственные вопросы. Вопросы не должны быть слишком сложными, чтобы подходить для документированного решения проблем, но они должны требовать многоэтапного мышления , чтобы прийти к ответу.

Вопросы экономики, которые хорошо подходят для этого подхода, включают следующие:

  • Попросите учащихся следовать предсказуемым путем, чтобы прийти к правильному ответу.
  • Включите вычисления и попросите учащихся выбрать правильное уравнение для использования.
  • Включите данные и попросите учащихся интерпретировать их.
  • Призовите студентов думать не только о том, что было сказано на лекции или обсуждено в тексте.
  • Попросите учащихся объединить несколько независимых концепций или идей, чтобы получить правильный ответ.
  • Обращайтесь к темам, с которыми студенты обычно сталкиваются.

Подходящий экономический вопрос, для которого студенты могут написать задокументированное решение проблемы, потому что это требует многоэтапного процесса.

Для продукта XYZ эластичность спроса по цене имеет абсолютное значение 3. Ceteris paribus , это означает, что объем спроса увеличится на:

a) 1 процент за каждые 3 процента снижения цены. б) 1 единица за каждые 3 доллара снижения цены.

c) 3 процента за каждый 1 процент снижения цены. г) 3 единицы на каждый доллар снижения цены.

Ответ студента: Сначала я открыл свои заметки, чтобы прочитать определение ценовой эластичности спроса. Ценовая эластичность измеряет изменение объема спроса из-за изменения цены. Формула: (% изменение объема спроса) ÷ (% изменение цены). Таким образом, для того, чтобы получить ответ 3, 3 идет вверху (изменение спроса в%), а 1 идет внизу (изменение цены в%).Действительное число отрицательное 3, потому что цена и объем спроса движутся в противоположных направлениях. По этому вопросу, если цена повышается на 1%, объем спроса снижается на 3%. Затем я посмотрел на варианты ответов, чтобы увидеть, какой из них подходит. Если цена упадет на 1%, то объем спроса вырастет на 3%, так что c - правильный ответ.

Вопросы экономики, которые не подходят для этого подхода

Вопросы типа определения и вопросы, которые просят учащихся выбрать из списка, - это не хороший выбор, если они просто требуют от учащихся вспомнить заученную информацию.В таком случае ученику не нужно описывать несколько шагов. Помните, что одна из основных причин использования документированного решения проблем - помочь учащимся разбить процесс решения на отдельные этапы, которые в конечном итоге помогут им развить навыки аналитического и критического мышления.

Неподходящий экономический вопрос, для которого учащиеся не могут написать задокументированное решение проблемы, потому что не требуется навыков решения проблем.

Какая из следующих стран производит больше всего продукции каждый год?

а) Китай б) США в) Россия г) Мексика

Ответ учащегося: Соединенные Штаты, потому что так написано в таблице в тексте.

Однако, учитывая, что большая часть экономики полагается на аналитические рассуждения, легко найти множество подходящих вопросов.

Начало работы с задокументированным решением проблем

Большая часть информации, необходимой для начала использования задокументированного решения проблем, представлена ​​начиная с главной страницы этого модуля.

.

Руководство по решению социальных проблем с помощью машинного обучения

Сегодня вечер воскресенья. Вы заместитель мэра большого города. Вы садитесь смотреть фильм и просите Netflix о помощи. («Буду ли я любить Birdemic? Ishtar? Zoolander 2?»). Алгоритм рекомендаций Netflix предсказывает, какой фильм вам понравится, путем анализа данных о миллионах предыдущих зрителей с использованием сложных инструментов машинного обучения. А на следующий день вы идете на работу, и каждое из ваших агентств будет принимать решения о найме, не имея большого представления о том, какие кандидаты будут хорошими работниками; учащиеся общественных колледжей будут в основном предоставлены самим себе решать, какие курсы для них будут слишком сложными или слишком легкими; и ваша система социального обслуживания будет применять реактивный, а не превентивный подход к бездомности, потому что они не верят, что можно предсказать, какие семьи окажутся на улице.

Вы бы хотели перенести использование прогнозной аналитики в свой город в 21 век -го -го или, по крайней мере, в 20-й -й век -го. Но как? Вы только что наняли пару 24-летних программистов, чтобы они руководили вашей командой по анализу данных. Они отлично разбираются в данных. Но должны ли они решать, какие проблемы можно решить с помощью этих инструментов? Или решить, как выглядит успех? Вас также не успокаивают продавцы, с которыми взаимодействует город. Они всегда пытаются продать вам самый последний инструмент прогнозирования.Решения о том, как использовать эти инструменты, кажутся вам слишком важными для передачи на аутсорсинг, но поднимают множество новых проблем, которые трудно понять.

Insight Center

Такое сочетание энтузиазма и опасений по поводу потенциального социального воздействия машинного обучения характерно не только для местных органов власти или даже для правительства: некоммерческие организации и социальные предприниматели также разделяют это. Энтузиазм вполне уместен. Для решения правильного типа проблемы от использования этих инструментов можно получить огромную пользу.Но есть и беспокойство: как и в случае со всеми новыми «продуктами», существует вероятность неправильного использования. Как мы можем максимизировать пользу при минимизации вреда?

Применяя эти инструменты в последние несколько лет, мы сосредоточились именно на этом вопросе. Мы узнали, что некоторые из наиболее важных проблем находятся в разрыве между дисциплиной, которая создает алгоритмы (информатика), и дисциплинами, которые обычно работают над решением проблем политики (например, экономика и статистика). В результате, некоторые из этих ключевых проблем даже не видны никому.Хорошая новость заключается в том, что многие из этих проблем, если они осознаются, довольно просто решить.

Мы переработали то, что узнали, в «руководство для покупателя». Он предназначен для всех, кто хочет использовать науку о данных для создания общественного блага, но не знает, как действовать дальше.

Как машинное обучение может улучшить государственную политику

Перво-наперво: всегда есть новые «обновки». Особенно в социальной сфере. Стоит ли обращать внимание на эти инструменты машинного обучения?

Да.Это то, что мы пришли к выводу из нашего собственного проекта проверки концепции, применяя машинное обучение к набору данных из более чем одного миллиона судебных дел по облигациям (в совместной работе с Himabindu Lakkaraju и Jure Leskovec из Стэнфордского университета). Вскоре после ареста судья должен решить: будет ли подсудимый ждать своей законной судьбы дома? Или они должны ждать в тюрьме? Это немалый вопрос. Типичный срок тюремного заключения составляет от двух до трех месяцев. Принимая это судьбоносное решение, по закону, судья должен сделать прогноз: в случае освобождения ответчик вернется в суд или пропустит суд? И будут ли они потенциально совершать новые преступления?

Мы считаем, что есть много возможностей для улучшения прогнозов судей.Наши оценки показывают, что если бы мы принимали решения об освобождении до суда, используя прогнозы риска нашего алгоритма вместо того, чтобы полагаться на интуицию судьи, мы могли бы сократить количество преступлений, совершаемых освобожденными обвиняемыми, до 25% без необходимости сажать в тюрьму дополнительных людей. Или, вообще не увеличивая уровень преступности, мы могли бы заключить в тюрьму на 42% меньше людей. С учетом того, что в США ежегодно арестовывают 12 миллионов человек, этот тип инструмента может позволить нам сократить количество заключенных до нескольких сотен тысяч человек. И такого рода вмешательство относительно дешево.По сравнению с инвестированием миллионов (или миллиардов) долларов в большее количество социальных программ или полиции, стоимость статистического анализа уже существующих наборов административных данных практически равна нулю. Кроме того, в отличие от многих других предложений по улучшению общества, инструменты машинного обучения легко масштабируются.

К настоящему времени политики привыкли слышать подобные заявления в рекламных презентациях, и они должны вызывать определенный скептицизм. Одна из причин, по которой трудно быть хорошим покупателем решений для машинного обучения, заключается в том, что существует так много преувеличенных заявлений.Дело не в том, что люди намеренно искажают результаты своих алгоритмов. Фактически, применение известного алгоритма машинного обучения к набору данных часто является самой простой частью этих проектов. Гораздо сложнее и причина, по которой мы боролись с нашим собственным проектом по освобождению под залог в течение нескольких лет, - это точная оценка потенциального воздействия любого нового алгоритма на результаты политики. Мы надеемся, что оставшаяся часть этой статьи, основанная на нашем собственном опыте применения машинного обучения для решения проблем, связанных с политикой, поможет вам лучше оценить эти предложения и сделает вас важным покупателем.

Ищите политические проблемы, которые зависят от прогноза

Наш опыт освобождения под залог показывает, что продуманное применение машинного обучения к политике может дать очень большую прибыль. Но иногда эти инструменты продаются как змеиное масло, как будто они могут решить каждую проблему .

Машинное обучение отлично умеет предсказывать вещи. Он может информировать решения, которые зависят от прогноза, и где то, что нужно предсказать, является ясным и измеримым.

Для Netflix решение - какой фильм смотреть. Netflix собирает данные о большом количестве пользователей, чтобы попытаться выяснить, у каких людей предыдущая история просмотра похожа на вашу, а затем рекомендует фильмы, которые понравились этим людям. Для нашего приложения к досудебным решениям об освобождении под залог алгоритм пытается найти прошлых обвиняемых, которые похожи на того, кто в настоящее время находится в суде, а затем использует уровень преступности этих аналогичных обвиняемых в качестве основы для своего прогноза.

Если принимается решение, которое уже зависит от прогноза, почему , а не помогают информировать это решение с помощью более точных прогнозов? Закон и требует, чтобы судьи судов по облигациям выносили решения об освобождении до суда на основе своих прогнозов риска ответчика.Десятилетия поведенческой экономики и социальной психологии учат нас, что людям будет сложно делать точные прогнозы относительно этого риска, потому что для этого требуются вещи, в которых мы не всегда хороши, например, вероятностное мышление, установление атрибуции и выводы. Алгоритм делает те же прогнозы, которые уже делают судьи, но лучше.

Но многие решения в социальном секторе не зависят от прогнозов. Иногда мы спрашиваем, работает ли какая-то новая политика или программа - то есть вопросы, которые зависят от понимания причинного воздействия чего-либо на мир.Ответить на эти вопросы нельзя с помощью методов прогнозирования машинного обучения. Вместо этого нам нужны инструменты для установления причинной связи, такие как рандомизированные эксперименты. Кроме того, то, что что-то предсказуемо, не означает, что нам удобно, когда наше решение зависит от этого предсказания. Например, нам может быть некомфортно отказывать в социальном обеспечении тому, кто имел на это право на момент подачи заявления, только потому, что мы прогнозируем, что они с большой вероятностью не выполнят требования программы по поиску работы или не пройдут тест на наркотики в будущем.

Убедитесь, что вас устраивает прогнозируемый результат

Алгоритмы наиболее полезны при применении к проблемам, в которых есть не только обширная история прошлых случаев, из которых можно извлечь уроки, но также и четкий результат, который можно измерить, поскольку конкретное измерение результата является необходимой предпосылкой для прогнозирования. Но алгоритм предсказания, сам по себе, будет постоянно фокусироваться на предсказании результата, который вы дадите, как можно точнее за счет всего остального.Это создает опасность: если вас интересуют и других исходов , они будут проигнорированы. Таким образом, даже если алгоритм хорошо справляется с результатом, на котором вы сказали ему сосредоточиться, он может хуже справиться с другими результатами, которые вас интересуют, но не сказали ему предсказать.

Эта проблема неоднократно возникала в нашей работе над решениями об освобождении под залог. Мы обучили наши алгоритмы прогнозированию общего уровня преступности для правозащитников, имеющих право на освобождение под залог. Такой алгоритм рассматривает все преступления как равные. Но что, если судьи (небезосновательно) придают непропорционально большое значение тому, участвует ли обвиняемый в очень серьезном насильственном преступлении, таком как убийство, изнасилование или грабеж? Если посмотреть на общий уровень преступности, может выглядеть так, как будто предсказания алгоритма приводят к «лучшим результатам».Но правило освобождения алгоритма может быть хуже, чем у судей, в частности, в отношении серьезных насильственных преступлений. Возможность этого не означает, что алгоритмы все еще не могут быть полезными. При освобождении под залог оказывается, что разные формы преступлений достаточно коррелированы, так что алгоритм, обученный только одному типу преступлений, в конечном итоге опережает судей почти по всем критериям преступности, которые мы могли бы сконструировать, включая насильственные преступления. Дело в том, что результат, который вы выбираете для своего алгоритма, будет определять его.Поэтому вам нужно тщательно подумать о том, что это за результат и что еще он может упустить.

Проверка смещения

Еще один серьезный пример этого принципа - роль гонки в алгоритмах. Существует вероятность того, что любая новая система прогнозирования и принятия решений может усугубить расовое неравенство, особенно в таких областях политики, как уголовное правосудие. Следует соблюдать осторожность: базовые данные, используемые для обучения алгоритма, могут быть предвзятыми, отражая историю дискриминации.А специалисты по обработке данных могут иногда непреднамеренно сообщать о вводящих в заблуждение показателях производительности своих алгоритмов. Мы должны серьезно отнестись к беспокойству о том, могут ли алгоритмы увековечить недостатки, независимо от других преимуществ.

Однако в конечном итоге это эмпирический вопрос. В нашем проекте по освобождению под залог мы обнаружили, что алгоритм действительно может уменьшить расовых различий среди заключенных. Другими словами, мы можем снизить преступность, количество заключенных в тюрьмы на и расовых предубеждений - и все это одновременно - с помощью алгоритмов.

Это не случайность. Подходящим первым эталоном для оценки эффекта от использования алгоритмов является существующая система - прогнозы и решения, уже сделанные людьми. В случае залога мы знаем из десятилетий исследований, что эти человеческие прогнозы могут быть необъективными. У алгоритмов есть форма нейтралитета, которую человеческий разум пытается получить, по крайней мере, в пределах их узкой области внимания. Как мы видели, вполне возможно, что алгоритмы будут служить движущей силой справедливости.Нам следует сочетать нашу осторожность с надеждой.

Урок здесь в том, что если конечный результат, который вас волнует, трудно измерить или включает в себя сложно определяемую комбинацию результатов, то проблема, вероятно, не подходит для машинного обучения. Рассмотрим проблему, когда выглядит как как залог: приговор. Как и залог, вынесение приговора лицам, признанным виновным, частично зависит от риска рецидива. Но вынесение приговора также зависит от таких вещей, как чувство возмездия, милосердия и искупления общества, которое нельзя измерить напрямую.Мы намеренно сосредоточили нашу работу на освобождении под залог, а не на вынесении приговора, потому что это представляет собой точку в системе уголовного правосудия, где закон явно требует узкого прогноза. Даже если есть измеримый единственный результат, вы захотите подумать о других важных факторах, которые не включены в этот результат - как мы сделали с гонкой в ​​случае залога - и поработать со своими специалистами по данным, чтобы создать план чтобы проверить свой алгоритм на предмет потенциальной предвзятости по этим параметрам.

Проверьте свой алгоритм в эксперименте на данных, которых он не видел

После того, как мы выбрали правильный результат, последняя потенциальная ловушка связана с тем, как мы измеряем успех.Чтобы машинное обучение было полезным для политики, оно должно точно прогнозировать «вне выборки». Это означает, что его нужно обучить на одном наборе данных, а затем протестировать на наборе данных, которого он раньше не видел. Поэтому, когда вы предоставляете данные поставщику для создания инструмента, не используйте их часть. Затем, когда поставщик вернется с готовым алгоритмом, вы можете провести независимый тест, используя свой «выдержанный» образец.

Еще более фундаментальная проблема заключается в том, что современные подходы в этой области обычно сосредоточены на показателях производительности, которые для многих приложений изначально ошибочны.Текущая практика состоит в том, чтобы сообщать о том, насколько хорошо алгоритм предсказывает только те случаи, когда мы можем наблюдать результат. В заявлении об освобождении под залог это означает, что наш алгоритм может использовать данные только о тех подсудимых, которые были освобождены судьями, потому что у нас есть только ярлык , дающий правильный ответ на вопрос о том, совершил ли подсудимый преступление или нет, для подсудимых, которых судьи решили освободить. А как насчет подсудимых, которых судьи решили не освобождать? Имеющиеся данные не могут сказать нам, совершили бы они повторное преступление или нет.

Это затрудняет оценку того, действительно ли какой-либо новый инструмент машинного обучения может улучшить результаты по сравнению с существующей системой принятия решений - в данном случае с судьями. Если какое-то новое правило освобождения на основе машинного обучения хочет освободить кого-то, кого посадили в тюрьму судьи, мы не можем наблюдать за его «ярлыком», так как же нам узнать, что произойдет, если мы действительно освободим его?

Это проблема не только академического интереса. Представьте, что судьи имеют доступ к информации об обвиняемых, которой нет у алгоритма, например к тому, появляются ли члены семьи в суде, чтобы поддержать их.В качестве упрощенного крайнего примера предположим, что судья особенно точно использует эту дополнительную информацию и может применить ее, чтобы точно предсказать, совершат ли молодые обвиняемые повторное преступление или нет. Поэтому судьи освобождают только тех молодых людей, которые не подвергаются риску рецидива. Алгоритм получает данные только о тех молодых людях, которые были освобождены - тех, кто никогда не совершал повторных преступлений. Такой алгоритм, по сути, сделает вывод, что судья совершает серьезную ошибку, заключая в тюрьму так много молодых обвиняемых (поскольку ни один из его данных не продолжает совершать преступления).Алгоритм рекомендует освободить гораздо более молодых подсудимых. Алгоритм был бы неправильным. В результате это может непреднамеренно ухудшить положение мира.

Короче говоря, тот факт, что алгоритм хорошо предсказывает ту часть тестовых данных, где мы можем наблюдать метки, не обязательно означает , что означает, что он будет делать хорошие прогнозы в реальном мире. Лучший способ решить эту проблему - провести рандомизированное контролируемое исследование, которое широко распространено в медицине. Затем мы могли бы напрямую сравнить, приводят ли решения об освобождении под залог, принятые с использованием машинного обучения, к лучшим результатам, чем решения, принятые по сопоставимым делам с использованием текущей системы принятия судебных решений.Но еще до того, как мы дойдем до этой стадии, нам нужно убедиться, что инструмент достаточно многообещающий, чтобы этически оправдать его тестирование в полевых условиях. В нашем случае залога большая часть усилий ушла на поиск «естественного эксперимента» для оценки инструмента.

Наш естественный эксперимент основан на двух выводах. Во-первых, в пределах юрисдикции судьи, которые рассматривают какие дела, по существу случайны. Во-вторых, судьи очень разные по своей снисходительности. Это позволяет нам измерить, насколько хороши судьи при отборе дополнительных обвиняемых в тюрьму.Насколько снижает уровень преступности судья с показателем освобождения 70% по сравнению с судьей с показателем освобождения 80%? Мы также можем использовать эти данные, чтобы узнать, насколько хорош алгоритм при отборе дополнительных обвиняемых в тюрьму. Если мы возьмем дело с 80% -ным показателем освобождения и воспользуемся нашим алгоритмом, чтобы отбирать еще 10% обвиняемых для тюремного заключения, сможем ли мы добиться более низкого уровня преступности, чем тот, который получает судья с 70-процентным показателем освобождения? Это сравнение «человек против машины» не сбивается с толку из-за отсутствия ярлыков для обвиняемых, которых судьи заключили в тюрьму, но алгоритм хочет освободить, потому что мы всего лишь просим алгоритм рекомендовать дополнительные задержания (а не освобождение).Это сравнение опирается только на ярлыки, которые у нас уже есть в данных, и оно подтверждает, что прогнозы алгоритма действительно приводят к лучшим результатам, чем прогнозы судей.

Может быть ошибочным, а иногда и совершенно вредным, внедрять и расширять новые инструменты прогнозирования, когда они оцениваются только на основе исторических данных с ярлыками, а не оцениваются на основе их влияния на ключевое политическое решение, представляющее интерес. Умные пользователи могут пойти так далеко, что откажутся от использования любого инструмента прогнозирования, который не воспринимает эту задачу оценки более серьезно.

Помните, что мы еще многого не знаем

В то время как машинное обучение сейчас широко используется в коммерческих приложениях, использование этих инструментов для решения проблем политики является относительно новым. Мы еще многого не знаем, но нам нужно будет решить, что делать дальше.

Возможно, наиболее важным примером этого является то, как объединить человеческое суждение и алгоритмическое суждение для принятия наилучших возможных политических решений. В области политики трудно представить переход в мир, в котором алгоритмы фактически принимают решения; мы ожидаем, что вместо этого они будут использоваться в качестве вспомогательных средств для принятия решений.

Чтобы алгоритмы добавляли ценность, нам нужны люди, которые их действительно используют; то есть обратить на них внимание хотя бы в некоторых случаях. Часто утверждается, что для того, чтобы люди захотели использовать алгоритм, они должны действительно понимать, как он работает. Может быть. Но многие ли из нас знают, как работают наши машины, наши iPhone или кардиостимуляторы? Кто из нас променял бы производительность на понятность собственной жизни, например, отказавшись от нынешнего автомобиля с его загадочным двигателем внутреннего сгорания в пользу автомобиля Фреда Флинтстоуна?

Обратной стороной является то, что директивным органам необходимо знать, когда им следует игнорировать алгоритм.Чтобы люди знали, когда переопределять, им нужно понимать свое сравнительное преимущество перед алгоритмом - и наоборот. Алгоритм может проанализировать миллионы случаев из прошлого и рассказать нам, что происходит в среднем. Но часто только человек может увидеть смягчающее обстоятельство в данном случае, поскольку оно может быть основано на факторах, не учтенных в данных, на которых был обучен алгоритм. Как и с любой новой задачей, вначале люди будут плохо справляться с этим. Хотя со временем они должны стать лучше, было бы очень полезно больше узнать о том, как ускорить эту кривую обучения.

Пара осторожность с надеждой

Путешественник во времени, возвращающийся в начало 20 века -го и -го, прибудет с ужасными предупреждениями. Одно изобретение могло нанести большой вред. Это станет одной из основных причин смерти, а для некоторых возрастных групп - самой большой причиной смерти. Это усугубит неравенство, потому что те, кто сможет себе это позволить, смогут получить больше рабочих мест и жить более комфортно. Это изменит облик планеты, на которой мы живем, затронув физический ландшафт, загрязняя окружающую среду и способствуя изменению климата.

Путешественник во времени не хочет, чтобы эти предупреждения вызывали поспешную панику, которая полностью препятствует развитию автомобильного транспорта. Вместо этого она хочет, чтобы эти предупреждения помогли людям пропустить несколько шагов и пойти по более безопасному пути: сосредоточиться на изобретениях, которые делают автомобили менее опасными, построить города, обеспечивающие легкий доступ к общественному транспорту, и сосредоточиться на транспортных средствах с низким уровнем выбросов.

Путешественник во времени из будущего, говорящий с нами сегодня, может прийти с аналогичными предупреждениями о машинном обучении и поощрить аналогичный подход.Она может способствовать распространению машинного обучения, которое поможет решать самые сложные социальные проблемы и улучшить жизнь многих. Она также напоминала нам, чтобы мы были внимательны и пристегивались ремнями безопасности.

.

vkoul / Econ-Data-Science: Статьи / Журналы и видео по экономике и науке о данных

перейти к содержанию Зарегистрироваться
  • Почему именно GitHub? Особенности →
    • Обзор кода
    • Управление проектами
    • Интеграции
    • Действия
    • Пакеты
    • Безопасность
    • Управление командой
    • Хостинг
    • мобильный
    • Истории клиентов →
    • Безопасность →
  • Команда
  • Предприятие
  • Проводить исследования
    • Изучить GitHub →
    Учитесь и вносите свой вклад
    • Темы
    • Коллекции
.

Prediction Engineering: Как настроить проблему машинного обучения | by Will Koehrsen

Для данного набора данных существует многочисленных задач прогнозирования , которые мы можем сделать из него. Мы могли бы захотеть спрогнозировать отток в разные даты или с разной частотой, например, каждые две недели, со сроком выполнения заказа в два месяца, или определить отток как более короткий период без активного членства. Более того, есть другие проблемы, не связанные с оттоком клиентов, которые мы могли бы решить с помощью этого набора данных: спрогнозировать, сколько песен клиент послушает в следующем месяце; спрогнозировать темпы роста клиентской базы; или сегментируйте клиентов на разные группы на основе привычек слушателей, чтобы получить более личный опыт.

Когда мы разрабатываем функции для создания меток, мы делаем наши входные параметры так, чтобы мы могли быстро создать нескольких наборов меток из набора данных .

Если мы разработаем конвейер с параметрами вместо жестко запрограммированных значений, мы сможем быстро адаптировать его для решения различных задач. Когда мы хотим изменить определение оттока, все, что нам нужно сделать, это изменить ввод параметров в наш конвейер и повторно запустить его.

Реализация маркировки

Для создания этикеток мы разрабатываем 2 функции (полный код в записной книжке):

 label_customer (customer_transactions, prediction_date = "first of month", days_to_churn = 31, lead_time = "1 month", prediction_window = "1 месяц") 
make_labels (all_transactions, prediction_date = "first of month", days_to_churn = 31, lead_time = "1 month", prediction_window = "1 month")

Функция label_customer принимает транзакции клиента и указанные параметры и возвращает таблицу времен метки.В этой таблице есть набор времен прогнозирования - времен отключения - и метка в течение окна прогнозирования для каждого времени отключения, соответствующего одному заказчику.

Например, наши этикетки для клиента выглядят следующим образом:

Количество этикеток для одного клиента.

Затем функция make_labels принимает транзакции для всех клиентов вместе с параметрами и возвращает таблицу с временами отсечения и меткой для каждого клиента.

Следующие шаги

При правильной реализации конечным результатом проектирования прогнозирования является функция, которая может создавать метки времени для множества задач прогнозирования путем изменения входных параметров.Эти времена меток - время отсечки и связанная метка - являются входными данными для следующего этапа, на котором мы создаем функции для каждой метки. В следующей статье этой серии рассказывается, как работает разработка функций.

.

Смотрите также