Меню Закрыть

Номинал вводного автомата: Какой вводной автомат поставить на квартиру

Содержание

Какой вводной автомат поставить на квартиру

Подвод электропитания к любой электросхеме производится через автомат и квартирная проводка не является исключением. Такой автоматический выключатель называется «вводной» и он используется для отключения всех электроприборов одновременно. Параметры такого устройства выбираются по определённым правилам и для надёжной защиты линии необходимо знать, какой вводной автомат поставить на квартиру.

Для чего нужен вводной автомат

По своему устройству автоматический выключатель, установленный на вводе в квартиру, ничем кроме мощности, не отличается от защитных устройств, подключенных к отдельным линиям или группам электроприборов.

Разница заключается в назначении этого прибора и месте его установки. Вводной автомат в квартиру может находиться не только во внутриквартирном щитке, но и подъездном электрощите.

Этот аппарат выполняет несколько функций:

  • Полное отключение электроэнергии в квартире. Это необходимо при ремонте электропроводки и электросчётчика. Согласно ПУЭ п.7.1.64 вводной автомат необходимо смонтировать до прибора учёта электроэнергии, однако он может дублироваться выключателем, находящимся в квартире после счётчика. В этом случае выключатель, расположенный в электрощитке, отключает только внутриквартирные сети.
  • Ограничение потребляемой мощности. Для предотвращения перегрузки понижающего трансформатора и перегрева кабелей электрокомпания ограничивает ток, потребляемый каждой отдельной квартирой. Эта операция производится путём установки в опломбированной коробке автомата с номинальным током, величина которого определяется различными нормативными документами и договором между поставщиком электроэнергии и владельцем квартиры.
  • Защита вводного кабеля от перегрева вследствие перегрузки или короткого замыкания. Это происходит при включении большого количества электроприборов в разные линии, даже если мощность каждого из устройств не превышает допустимую для автоматического выключателя линии. Для обеспечения селективности защиты номинальный ток автомата должен быть выше уставок защитных приборов, подключенных после него.

На сколько Ампер можно — нормативные документы

То, какой вводной автомат поставить на квартиру, определяется различными нормативными документами, один из которых ГОСТ 32395-2013 «Щитки распределительные для жилых зданий».

Здесь в п.Б.4 указано, что величина уставки вводного автомата составляет 50А при наличии в квартире электроплиты или 32А,

если в квартире установлена газовая плита. Эта величина может уменьшаться по согласованию с потребителем.

Согласно СП 256.1325800.2016 «Электроустановки жилых и общественных зданий. Правила проектирования и монтажа», сечение токопроводящей жилы подходящих проводов определяется расчётной нагрузкой, а уставка автомата должна быть ниже допустимого тока кабеля.

При этом провод определяется по ПУЭ п.3.1.10 т.3.1.4, а уставка автомата выбирается из стандартного ряда значений.

Номинал вводного автомата

До 2003 года номинал автомата на вводе в квартиру определялся ВСН 59-88 «Электрооборудование жилых и общественных зданий». Номинальный ток вводного автомата, устанавливался на 16 А и выбирался он из расчета 3 кВт разрешенной мощности нагрузки.

Этот документ был введён в действие ещё в 1989 году и не учитывал появление в быту электроприборов большой мощности, таких, как автоматические стиральные машины, кондиционеры, электрические бойлеры и другие.

В 2003 году были введены в действие СП 256.1325800.2016 «Электроустановки жилых и общественных зданий». Согласно этому документу разрешённая потребляемая мощность и номинал вводного автомата зависят от наличия в квартире электроплиты.

В квартире с электроплитой

Мощность этого электроприбора, в зависимости от модели, может достигать 7кВт, но чаще всего электроплита используется вместе с мультиваркой и микроволновой печью, поэтому для приготовления пищи многим семьям достаточно двухконфорочной индукционной плиты с током потребления 10А, что так же делает невозможным одновременное использование электроплиты и других электроприборов.

Поэтому СП 256.1325800.2016 в ттаблице 7.1 определяет необходимую мощность при отсутствии газовой плиты 10кВт или 45А. При ближайшем большем стандартном значении уставок автоматов 50А разрешённая мощность получается 11кВт.

В квартире с газовой плитой

При наличии газовой плиты необходимая мощность намного ниже. Поэтому СП 256.1325800.2016 в т.7.1 указывает необходимую электрическую мощность в квартирах без электроплит 4,5кВт или 20А. При стандартной уставке 25А разрешённая мощность получается 5,5кВт.

Эти данные дублируются в ГОСТ 32395-2013 «Щитки распределительные для жилых зданий» в приложении Б.4

Подключение вводного автомата

Кроме расчёта, на сколько ампер ставить вводной автомат, его необходимо правильно подключить. Неправильный монтаж приведёт к некорректной работе защиты.

Однополюсный или двухполюсный

В однофазной электропроводке напряжение относительно заземлённых конструкций присутствует только на фазном проводе и для отключения линии достаточно установить только однополюсный разъединитель.

Однако для вводного автомата одного полюса недостаточно, так как в аварийных ситуациях на нулевой клемме появляется напряжение и необходимо отключать оба проводника — нейтраль и фазу.

Такая ситуация возникает в разных случаях:

  • Обрыв нейтрали в подходящем кабеле. При этом по нулевому проводнику перестаёт протекать уравнительный ток и в сети появляется перекос фаз. При этом напряжение на клеммах розетки может колебаться от 0 до 380В, а на нейтральном контакте оно может достигать 220В.
  • Короткое замыкание между фазным и нулевым проводниками. Это чаще всего происходит в воздушных линиях электропередач. При обрыве из-за сильного ветра или гололёда нейтрального или фазного проводов может произойти короткое замыкание и в розетке вместо ноля появится вторая фаза.
  • Перекос фаз. При значительной длине ЛЭП, малом сечении проводов и неравномерном распределении потребителей по фазам происходит
    значительное падение напряжения
    и потенциал на нулевой клемме может достигать 20-30В, а в некоторых случаях и выше. Ремонт электропроводки в таких условиях невозможен и для него необходимо отключать оба провода.
Информация! При трёхфазной электропроводке подключается трёхполюсный вводной автомат, а четырёхполюсный разъединитель устанавливается на вводе в многоквартирный дом.

Установка перед счетчиком или после

Кроме количества полюсов при монтаже вводного автомата имеет значение место установки этого устройства. Существует два варианта расположения автоматического выключателя — до электросчётчика и после него, однако ПУЭ указывает, что этот защитный прибор

должен быть подключён ДО прибора учёта.

Это необходимо для ремонта или замены счётчика, а так же отключения питания квартиры при неуплате счёта за потреблённую электроэнергию.

Этот защитный прибор находится в опломбированном ящике и самовольная распломбировка приведёт к наложению штрафа инспектором электрокомпании

Однако при расположении электросчётчика в подъезде для отключения питания квартиры необходимо выходить на лестничную площадку, что занимает некоторое время, а в аварийных ситуациях, например при перекосе фаз, может быть дорога каждая секунда.

Поэтому в некоторых ситуациях может оказаться целесообразным установить два вводных автоматических выключателя:

  1. Вводной автомат в этажном щитке. Его параметры определяются сечением подходящего кабеля и разрешённой потребляемой мощностью.
  2. Выключатель нагрузки в квартирном щите. Уставка этого выключателя должна быть равна или выше номинального тока прибора защиты, находящегося в этажном щитке.

Согласно ПУЭ п.3.1.6 подходящий кабель рекомендуется присоединять к неподвижным контактам автомата, а фактически к верхним клеммам, но эта рекомендация соблюдается всеми грамотными электромонтёрами и является скорее правилом, упрощающим ремонт электропроводки и делающим его более безопасным.

Расчёт номинального тока вводного автомата

Перед тем, как выбрать вводной автомат для квартиры, необходимо рассчитать его номинальный ток. В тех случаях, когда этот параметр определяется электрокомпанией, устанавливается автоматический выключатель с заданной уставкой, однако при необходимости максимальную мощность можно увеличить.

Расчёт необходимой мощности

В квартире устанавливается большое количество электроприборов и для определения максимальной мощности необходимо составить список электроприборов, работающих одновременно. Например, это могут быть:

  • электроплита — 5кВт;
  • электрический бойлер — 2,2кВт;
  • стиральная машина-автомат — 2,2кВт;
  • микроволновая печь — 1,2кВт;
  • электрический чайник — 1,8кВт;
  • остальные электроприборы — 1кВт.

Всего общая потребляемая мощность составит 13,4 кВт и для этого достаточно подключить квартиру к однофазной сети 220 В. При наличии электроотопления 15 кВт для одновременной работы всех устройств необходимо 28,4кВт и желательно такую нагрузку присоединять к трёхфазной сети 380 В.

Для напряжения 220В

Необходимый номинальный ток для однофазной сети рассчитывается по формуле I(А)=P(Вт)/U(В)=Р(Вт)/220≈Р(кВт)х4,5 и, при мощности одновременно включаемых электроприборов 13,4 кВт необходимо подключить вводной автомат с уставкой I=13400/220=60 А.

Из ряда стандартных значений выбираем автомат с номинальным током 63 А, что обеспечит максимальную мощность 13,9 кВт.

Для напряжения 380В

Трёхфазное электропитание чаще всего используется при наличии электроотопления или, в частных домах, сауны с электроподогревом.

Такое оборудование увеличивает необходимую мощность до 28,4 кВт и для уменьшения тока нагрузку необходимо равномерно разделить по 3 фазам 28,4/3=9,46 кВт, однако надёжнее распределить электроприборы вручную.

У трёхфазного электрического котла потребление составит 5 кВт на каждую фазу, остальные приборы разделятся следующим образом:

  1. Фаза А. Электроплита 5 кВт, отопление 5 кВт, всего 10 кВт.
  2. Фаза В. Электрический бойлер 2,2 кВт и стиральная машина 2,2 кВт, отопление 5 кВт, всего 9,4 кВт.
  3. Фаза С. Микроволновка 1,2 кВт, электрочайник 1,8 кВт, другие электроприборы 1 кВт, отопление 5 кВт, всего 9 кВт.

Уставка автоматического выключателя выбирается по самой нагруженной фазе 10000/220=45 А.

Из стандартного ряда уставок выбираем ближайшее большее значение 50 А. Это обеспечит максимальную мощность одновременно включённых электроприборов 11 кВт для каждой фазы или общую мощность 33 кВт.

Вывод

От правильного расчёта защиты зависит безопасность жителей квартиры и всего дома, поэтому знать, какой вводной автомат поставить на квартиру, необходимо для определения параметров этого устройства.

Этот аппарат служит для защиты вводного кабеля от перегрузки и короткого замыкания, а так же используется для ограничения потребляемой мощности, поэтому его уставка определяется электрокомпанией, но при этом не может быть больше номинального тока подходящего провода.

Похожие материалы на сайте:

Понравилась статья — поделись с друзьями!

 

Номиналы групповых автоматов больше номинала вводного

Приветствую вас, уважаемые читатели сайта elektrik-sam.info!

В обратную связь пришло письмо от читателя сайта с вопросом: «А как быть в том случае, когда сумма номиналов автоматов по группам превышает номинал вводного автоматического выключателя? Хочется сделать стиральную машину на отдельный автомат, кондиционер на отдельный, свет отдельно, розетки отдельно, бойлер отдельно.»

Вопрос интересный, поэтому решил написать ответ в статье на сайте.

Давайте рассмотрим схему электропроводки, в которую входят все перечисленные в письме группы.

Номинал вводного автомата 32А. Сумма номиналов групповых автоматических выключателей:

16А+16А+16А+16А+10А=74А.

Сумма номиналов групповых автоматов более, чем в два раза превышает номинал вводного.

Разбивать электропроводку на группы можно, главное, чтобы при этом  номиналы автоматических выключателей соответствовали сечению применяемого кабеля, поскольку номинал автомата выбирается, исходя из сечения защищаемого кабеля.

В нашем примере в группах с автоматами 16А (стиральная машина, бойлер, кондиционер, розетки) должен применяться кабель сечением 2,5 мм2, в группе освещения с автоматом 10А — сечением 1,5 мм2. Кабель от водного автомата номиналом 32А до групповых  — сечением 6 мм2.

Если суммарный ток в какой-нибудь из групп превысит номинал автомата, защищающего эту группу, то он сработает, защитив линию от перегрузки и возможного оплавления изоляции. При этом кабель в групповой линии не пострадает, поскольку он выбран с запасом, и автомат отключится при меньшем токе, чем может выдержать кабель этого сечения.

Т.е. в группах, при превышении мощности нагрузки, будет отключаться групповой автомат, защищая контролируемую цепь и электроприборы.

Аналогичным образом, если в группах будет одновременно подключено много электроприборов и суммарный ток через вводной автомат будет превышать его номинал (в нашем примере 32А), вводной автомат сработает, отключив внешнюю сеть от внутренней. Т.е. при перегрузке в домашней сети вводной автомат отключится, защищая тем самым кабель до групповых автоматов и всю внутреннюю сеть. При этом кабель до групповых автоматов также не пострадает,  и автомат отключится при меньшем токе, чем может выдержать кабель этого сечения.

Главное, чтобы номиналы применяемых автоматов соответствовали сечению используемого кабеля.

Смотрите видео «Номиналы групповых автоматов превышают номинал вводного»

Подробно последовательность выбора, расчетов, схемы подключения можно узнать в этом видеокурсе.

Полезные статьи по теме:

Автоматические выключатели УЗО дифавтоматы — подробное руководство.

Как выбирать автоматические выключатели, УЗО, дифавтоматы?

Почему в жару срабатывает автоматический выключатель?

Менять ли автоматический выключатель, если его «выбивает»?

Устройство и принцип действия УЗО.

Почему УЗО выбирают на ступень выше?

Работа УЗО при обрыве нуля.

 

Вводной автомат в квартиру какой номинал

Номинал вводного автомата

Устройство и принцип работы

В компактном корпусе находится механизм включения: два контакта, подвижный и неподвижный. При переводе рукоятки взвода в рабочее положение, контакты замыкаются и механически фиксируются во включенном состоянии.

Цепь, по которой протекает электроток, последовательно включает в себя два защитных устройства. Одно срабатывает при превышении установленного порога по температуре и току (биметаллическая пластина), второе размыкает контакты при коротком замыкании, а точнее при значительном превышении значения тока (электромагнитный расцепитель).

Если сила тока постепенно превышает допустимую величину (указана на маркировке автомата), пластина нагревается и механически размыкает контакты. При возникновении короткого замыкания, ток возрастает лавинообразно, и приводит в действие электромагнитный расцепитель. Для многополюсных автоматов достаточно превышения параметров хотя бы по одной линии. Отключится весь пакет контактов.

Во всех случаях срабатывания защиты, после исчезновения опасности автоматический выключатель не возвращается в исходное состояние. Для включения требуется человек.

Как выбрать автомат по величине силы тока

Мы уже знаем, что через этот выключатель будет протекать весь электроток для питания объекта. По закону Ома ясно, что нагрузка должна суммироваться исходя из всех потребителей в доме (квартире). Вычислить это значение довольно просто.

Совет: не обязательно рассчитывать потребление энергии, суммируя мощность всех электроприборов.

Конечно, вы можете одновременно включить бойлер, электродуховку, кондиционер и утюг. Но для такого «праздника жизни» потребуется мощная электропроводка. Да и технические условия под такую входную мощность обойдутся существенно дороже. У энергоснабжающих организаций, тарифы за согласование подключения растут в линейной зависимости от количества киловатт.

Для типовой квартиры можно предположить одновременную работу холодильника, телевизора, компьютера, кондиционера. В дополнение к ним допустимо включить один из мощных приборов: бойлер, духовку или утюг. То есть, суммарная мощность электроприборов не превысит 3 кВт. Освещение в расчет не берем, сегодня в каждом жилище установлены экономные лампы.

Это интересно: если вернуться на 20–30 лет назад, когда в каждой люстре были только лампы накаливания, двухкомнатная квартира при полном освещении могла расходовать 500–700 Вт только на свет.

Обычно, для запаса по мощности (возможны форс-мажорные обстоятельства), к расчетам добавляют 20–30%. Если вы забудете выключить бойлер, и начнете пользоваться утюгом при работающем кондиционере, не придется бежать к электрощитку для восстановления энергоснабжения. Получается: 4 кВт делим на 220 В (по закону Ома), потребляемый ток 18 А. Ближайший защитный автомат номиналом 20 А.

Для справки: большинство производителей электротехнических изделий, выпускают защитные автоматы следующих номиналов по току срабатывания:

2 А, 4 А, 6 А, 10 А, 16 А, 20 А, 25 А, 32 А, 40 А, 50 А, 63 А …

Маркировка есть в паспорте изделия, и обязательно на корпусе.

При более точном подборе устройства, особенно при использовании совместно с нестандартной нагрузкой (двигатели или другая нагрузка со значительными пусковыми токами) необходимо делать выбор не только по номинальному току, но и времятоковой характеристике.

Например, вводной автомат, приведенный ниже на картинке имеет номинальный ток 16А и характеристику типа «C» (разновидность «C» хорошо подходит для обычной стандартной нагрузки — наших квартир).

Подробнее о времятоковой характеристике расскажем далее.

Более высокие токи нас не интересуют, это превышает мощность 15 кВт. Такое подключение в квартиру вам никто не согласует. Обычно квартирный ввод ограничен автоматами с оком срабатывания порядка 32 А.

Для частного дома показатели могут быть выше. В расчет идет увеличенная жилая площадь, наличие хозяйственных построек с энергоснабжением, гараж, мастерская, мощные электроинструменты. Вводный автомат для подачи питания в частный дом обычно имеет ток срабатывания 50 А или 63 А.

Какие еще параметры важны при выборе

Количество полюсов

Для простоты восприятия, вынесем за скобки трехфазные выключатели. Выбираем между 1 и 2 полюсными конструкциями. С точки зрения Правил устройства электроустановок (ПУЭ), разницы нет. Но те же правила подразумевают качественную организацию заземления или зануления. А если возникнет проблема с появлением фазы на нуле (к сожалению, в старом жилом фонде это реально), то лучше будет полностью отключить вашу квартиру от линий электропередач. Поэтому, если вы можете выбрать какой вводной автомат устанавливать — возьмите двухполюсный.

Важно: такое подключение целесообразно для системы заземления TN-S. Если у вас в доме организована схема TN-C, можно устанавливать однополюсный автомат.

Существуют разные типы кривых времятоковых характеристик, обозначаются они латинскими буквами: A, B, C, D… Начиная с A и далее происходит постепенное загрубление чувствительности устройства. Например, тип «B» означает срабатывание электромагнитного расцепителя при 3–4 кратном превышении тока, тип «C» при 5–7 кратном, «D» при 10-ти кратном. Тепловой расцепитель будет срабатывать одинаковым образом у разных типов времятоковых характеристик.

Более точные данные всегда необходимо получать из документации производителя на каждое конкретное изделие, например, для вводных автоматов BA47-29 характеристики срабатывания следующие:

Пример графиков для BA47-29 с характеристиками (типами) B, C, D приведены ниже на картинке, зависимости для других типов можно найти на официальных сайтах производителей. Выбор того или иного типа обусловлен видом подключаемой нагрузки, а точнее ее способностью потреблять ток скачкообразно. Например, у двигателей пусковой ток превышает номинальный в несколько раз, и в зависимости от их разновидностей могут применяться устройства типа «C» или «D». Тип «B» рекомендован при нагрузках, не имеющих значительных пусковых токов.

Также, использование типов с уменьшенной чувствительностью срабатывания имеет смысл для увеличения вероятности срабатывания нижестоящих групп автоматических выключателей.

Номинальный ток

Основная характеристика, по которой и происходит, в основном, выбор устройства. Тем не менее, как мы убедились в предыдущем разделе, необходимо учитывать и времятоковую характеристику, так как реальный ток срабатывания зависит одновременно как от номинального тока, так и от типа характеристики. В ранее приведенных таблицах номинальный ток обозначен как In. Теоретически, при отсутствии пусковых токов, нагрузка, потребляющая ток, равный номинальному не должна приводить к срабатыванию (отключению) устройства.

Способ крепления

На сегодняшний день, альтернативы нет. Это выключатели, которые устанавливаются на DIN рейку. Никакого прямого прикручивания на стену или корпус щитка. Только монтаж на DIN фиксаторы. Однако, при использовании специальных аксессуаров возможны и другие типы крепления.

Прибор может быть в отдельном корпусе, или установлен в общий щит — это неважно. Главное, обеспечить свободный доступ для владельца. Важный момент: опломбировка вводного автомата. Есть множество способов ограничить доступ к контактам (для исключения несанкционированного подключения). Можно установить заглушки на отверстия для затяжки винтов на контактах.Или просто поставить пломбы на крышки, закрывающие контактные группы.Главное, чтобы после опломбирования можно было беспрепятственно включать и выключать энергоснабжения.

Схема включения вводного автомата

Помимо основной задачи (обеспечение электробезопасности), входной выключатель предназначен для отключения потребителя от энергоснабжения для проведения работ. Например, обслуживание прибора учета. Поэтому, в большинстве случаев автомат устанавливается перед электросчетчиком.

Это зона ответственности электриков, сюда хозяин квартиры (домовладения) не имеет права вмешиваться. Для многоквартирных домов — это подъездный щит, для частного дома — столб, забор, или наружная стена домовладения. Такая схема применяется на 90% объектов жилого фонда. Между опломбированным вводным автоматом, и прибором учета (на котором также стоят пломбы), доступа для несанкционированного подключения нет. Это сделано для предотвращения незаконного отбора электроэнергии. Многие домовладельцы устанавливают дублирующий вводной автомат, для удобства обслуживания и ремонта распределительного щитка. Он подключается между счетчиком энергии и групповыми автоматами, и монтируется внутри щитка квартиры (домовладения).

Как правильно подобрать автомат дублер?

Оптимальное решение — сила тока защиты должна быть меньше, чем на вводном устройстве, и больше, чем в групповых выключателях. Например, на входе установлен автомат на 32 А, а групповые автоматы на 20 А. Значит дублер должен срабатывать при токе нагрузки 25 А. Если такого соотношения невозможно добиться, токовая отсечка дублера должна соответствовать вводному автомату. В этом случае он просто выполняет роль размыкающего устройства (для проведения работ). А при аварийной ситуации — он будет срабатывать одновременно с входным устройством.

Источник: https://ProFazu.ru/elektrooborudovanie/zaschita/vvodnoj-avtomat.html

Вводный автомат – это средство коммутации электричества. Какие автоматы бывают, для чего нужны, как правильно выбирать, будет написано в статье.

Типы

Автомат выбирается с учетом схемы электросети и ее потребностей. Выделяют однополюсные, двухполюсные, трехполюсные и четырехполюсные устройства.

Однополюсный

Выключатель с одним полюсом используется в электрических сетях с одной фазой. Разные модели отличаются разными характеристиками, от которых зависит скорость отключения. В состав входят два механизма расцепителя — электромагнитный и тепловой.

Один срабатывает при коротком замыкании, второй при превышении нагрузки в течении определенного времени. Подсоединяется через верхнюю клемму, к нижней включается отходящий провод. Принцип действия такой же, как у отводящих автоматов, но номинал тока выше.

Двухполюсный

Используется в однофазном вводе. В конструкции блок с двумя полюсами, которые оснащены рычажками и общей блокировкой между механизмами выключения. То есть главное отличие от однополюсника в том, что при неполадке на любой из идущих от него линий, отключатся обе. Двухполюсники используются в типовых современных квартирах.

Нельзя заменить один двухполюсный выключатель двумя однополюсными автоматами! Это запрещено ПУЭ.

Трехполюсный

Для сетей на три фазы используются трехполюсники и четырехполюсники. Такие электросети есть в домах, где готовка пищи производится на электрических плитах. Для подключения трехполюсного автомата к каждой клемме подключается по фазе. В приборах с четырьмя полюсами дополнительно используется нейтральный провод.

При монтаже своими руками земля (не нейтраль) никогда не должна проходить через автомат.

Расчет автомата ввода

Перед приобретением автомата важно правильно его рассчитать.

Характеристики:

  • количество полюсов;
  • времятоковую характеристику;
  • номинальный ток;
  • установленная мощность;
  • номинальный ток утечки;
  • линейное напряжение;
  • селективность;
  • максимальный ток короткого замыкания.

Номинал тока определяется для одновременного подключения всех электроприборов в сеть. От тока зависит и мощность.

На мощные устройства, такие как водонагреватели и электрические плиты, ставятся дополнительные вводные автоматы.

Используются автоматы для систем TN-S и TN-C. В первом случае выбирается однополюсник с нулем или двухполюсник либо трехполюсник с нейтралью. Во втором случае нужен однополюсный (для сети 220 В) или трехполюсный (для 380 В) автомат.

Расчет для электросети квартиры 220 Вольт

Вводный автомат в квартиру с напряжением 220 В рассчитывается по следующей формуле:

Ip=Pp/(Uф*cosф). В этой формуле Uф – фазное напряжение, Рр – расчетная мощность, Ip – ток нагрузки. Cosф является безразмерной величиной, характеризующей наличие реактивной мощности.

Расчет для электросети квартиры 380 Вольт

Чтобы рассчитать выключатель для электросети 380 В, формула немного видоизменяется:

Ip=Pp/( Uн*cosф). Uн – это напряжение сети.

Выбирая устройство, номинальный ток следует увеличить на 10% для запаса.

Выбор ВА

Помимо основных критериев выбора есть и дополнительные. К ним относятся режим нейтрали, частота тока и величина линейного напряжения.

Режим нейтрали

Проще говоря, режим нейтрали – это способ заземления в доме. Традиционно в домах представлена система TN с различными вариациями. К наиболее распространенным относятся TN-C, TN-C-S и TN-S.

В системе TN-S имеется подводящий нулевой и рабочий провода, которые разделены от подстанции до потребителя энергии. Система TN-C представляет собой совмещенные подводящий нулевой и рабочий провода.

Частота тока

Одним из главных параметров электросети является частота тока. Это количество полных циклов изменения ЭДС (электро движущей силы) за одну секунду.

Для Российской Федерации это значение равняется 50 Гц. Проще говоря, ток 50 раз в секунду идет в одну сторону и 50 в другую проходя через нулевое значение 100 раз. Например обычная лампочка включенная в сеть с частотой 50Гц будет разгораться и тухнуть 100 раз в секунду.

Величина линейного напряжения

Для российских электросетей напряжение — фиксированная величина. Равняется 220 В или 380 В +- запас. Линейное — это напряжение между двумя фазами, которое на 60% больше, чем фазное. И соответственно = 380В.

Недопустимые ошибки при покупке

Самая главная ошибка при покупке устройств для защиты – это попытка экономить, не обращая внимания на критерии автомата. Неправильно подобранный автоматический выключатель приведет к негативным последствиям.

Также нежелательно покупать автоматы неизвестных производителей. Непроверенные приборы не будут выполнять свои обязанности в полной мере, и многие характеристики часто завышены.

Все главные ошибки связаны с неправильным расчетом номиналов. Пользователь может не учесть запас по току, неправильно выбрать линейное напряжение – это приведет к неправильному результату и, как следствие, покупке неподходящего автомата.

Советы по выбору:

  1. При заключении договора абонент заказывает необходимую мощность присоединения. Исходя из этого значения, рассчитывается место установки, нагрузка и другие параметры. Самопроизвольное увеличение нагрузки недопустимо, установка более мощного выключателя должна быть согласована с соответствующими службами.
  2. Нужно ориентироваться на электропроводку. Так, если бытовая техника выдерживает ток в 30 А, а старый провод рассчитан на предельное значение в 10 А, придется заменять проводку на более мощную или отказываться от прибора.
  3. Отдавать предпочтение нужно автомату с большим током, чем рассчитанное значение. Для прибора с 14 А нужно брать выключатель на 16 А и выше.
  4. Важно обратить внимание на селективность. Номинал вводного автомата обычно равняется 40 Ампер. Для электрической плиты ставится выключатель на 32 А. Осветительная группа и розетки требуют 10 А.
  5. В загородный дом или в гараж следует выбирать мощный выключатель. Это связано с тем, что могут использоваться мощные сварочные аппараты, погружные насосы и другая техника, требующая больших токов.
  6. Лучше устанавливать автоматику от одного производителя. Риск несоответствия оборудования друг с другом будет сведен к минимуму. Также при возникновении ситуации, требующей ремонта или замены, пользователю будет проще обратиться к одному изготовителю.
  7. Покупать приборы нужно в специализированном лицензионном магазине, который имеет соответствующие лицензии и сертификаты. Это сведет к минимуму риск покупки поддельного агрегата.

Это основные требования и правила по выбору автоматических выключателей для дома и дачи. Зная их, покупатель не допустит ошибки при покупке нужного прибора.

Вводный автоматический выключатель – это обязательное устройство для защиты дома. При возникновении экстренной ситуации прибор сработает и отключит подачу электроэнергии. Автоматы различаются по количеству полюсов, номинальному току, времятоковой характеристике, режиму нейтрали, напряжению сети и другим характеристикам. Перед покупкой следует обязательно рассчитать все параметры, иначе электробезопасность обеспечена не будет. При покупке важно избегать типовых ошибок и следовать советам, которые приведены выше.

Источник: https://elektrika.expert/jelektrooborudovanie-i-bezopasnost/vvodnoj-avtomat.html

Номиналы автоматических выключателей по току для грамотного подбора

Устройства для отключения электричества при перегрузках и коротких замыканиях устанавливают на входе в любую домашнюю сеть. Необходимо правильно рассчитать номиналы автоматических выключателей по току, иначе их работа будет неэффективной. Согласны?

Мы расскажем, как производится расчет параметров автомата, согласно которым подбирают это защитное устройство. Из предложенной нами статьи вы узнаете, как выбрать прибор, требующийся для защиты электросети. С учетом наших советов вы приобретете вариант, четко срабатывающий в опасный для проводки момент.

Содержание статьи:

Параметры автоматических выключателей

Для обеспечения правильного выбора номинала устройств отключения необходимо понимание принципов их работы, условий и времени срабатывания.

Рабочие параметры автоматических выключателей стандартизированы российскими и международными нормативными документами.

Основные элементы и маркировка

В конструкцию выключателя входят два элемента, которые реагируют на превышение силой тока установленного диапазона значений:

  • Биметаллическая пластина под воздействием проходящего тока нагревается и, изгибаясь, надавливает на толкатель, который разъединяет контакты. Это «тепловая защита» от перегрузки.
  • Соленоид под воздействием сильного тока в обмотке генерирует магнитное поле, которое давит сердечник, а тот уже воздействует на толкатель. Это «токовая защита» от короткого замыкания, которая реагирует на такое событие значительно быстрее, чем пластина.

Типы устройств электрической защиты обладают маркировкой, по которой можно определить их основные параметры.

На каждом автоматическом выключателе обозначены его основные характеристики. Это позволяет не перепутать устройства, когда они установлены в щитке

Тип времятоковой характеристики зависит от диапазона уставки (величины силы тока при которой происходит срабатывание) соленоида. Для защиты проводки и приборов в квартирах, домах и офисах используют выключатели типа «C» или, значительно менее распространенные – «B». Особенной разницы между ними при бытовом применении нет.

Тип «D» используют в подсобных помещениях или столярках при наличии оборудования с электродвигателями, которые имеют большие показатели пусковой мощности.

Существует два стандарта для устройств отключения: жилой (EN 60898-1 или ГОСТ Р 50345) и более строгий промышленный (EN 60947-2 или ГОСТ Р 50030.2). Они отличаются незначительно и автоматы обоих стандартов можно использовать для жилых помещений.

По номинальному току стандартный ряд автоматов для использования в бытовых условиях содержит приборы со следующими значениями: 6, 8, 10, 13 (редко встречается), 16, 20, 25, 32, 40, 50 и 63 A.

Время-токовые характеристики срабатывания

Для того чтобы определить быстроту срабатывания автомата при перегрузке существуют специальные таблицы зависимости времени отключения от коэффициента превышения номинала, который равен отношению существующей силы тока к номинальной:

K = I / In.

Резкий обрыв вниз графика при достижении значения коэффициента диапазона от 5 до 10 единиц, обусловлен срабатыванием электромагнитного расцепителя. Для выключателей типа «B» это происходит при значении от 3 до 5 единиц, а для типа «D» – от 10 до 20.

График показывает зависимость диапазона времени срабатывания автоматов типа «C» от отношения силы тока к значению, которое установлено для этого выключателя

При K = 1,13 автомат гарантированно не отключит линию в течение 1 часа, а при K = 1,45 – гарантированно отключит за это же время. Эти величины утверждены в п. 8.6.2. ГОСТ Р 50345-2010.

Чтобы понять, за какое время сработает защита, например, при K = 2, необходимо провести вертикальную линию от этого значения. В результате получим, что согласно приведенному графику, отключение произойдет в диапазоне от 12 до 100 секунд.

Столь большой разброс времени обусловлен тем, что нагрев пластины зависит не только от мощности проходящего через нее тока, но и параметров внешней среды. Чем выше температура, тем быстрее срабатывает автомат.

Правила выбора номинала

Геометрия внутриквартирных и домовых электрических сетей индивидуальна, поэтому типовых решений по установке выключателей определенного номинала не существует. Общие правила расчета допустимых параметров автоматов достаточно сложны и зависят от многих факторов. Необходимо учесть их все, иначе возможно создание аварийной ситуации.

Принцип устройства внутриквартирной разводки

Внутренние электрические сети имеют разветвленную структуру в виде «дерева» – графа без циклов. Соблюдение такого принципа построения называется , согласно которой оснащаются защитными устройствами все виды электрических цепей.

Это улучшает устойчивость системы при возникновении аварийной ситуации и упрощает работы по ее устранению. Также гораздо легче происходит распределение нагрузки, подключение энергоемких приборов и изменение конфигурации проводки.

У основания графа находится вводной автомат, а сразу после разветвления для каждой отдельной электрической цепи размещают групповые выключатели. Это проверенная годами стандартная схема

В функции вводного автомата входит контроль общей перегрузки – недопущение превышения силой тока разрешенного значения для объекта. Если это произойдет, то существует риск повреждения наружной проводки. Кроме того, вероятно срабатывание защитных устройств за пределами квартиры, которые уже относится к общедомовой собственности или принадлежит местным энергосетям.

В функции групповых автоматов входит контроль силы тока по отдельным линиям. Они защищают от перегрузки кабель на выделенном участке и подключенную к нему группу потребителей электроэнергии. Если при коротком замыкании такое устройство не срабатывает, то его страхует вводной автомат.

Даже для квартир с небольшим количеством электропотребителей желательно выполнить отдельную линию на освещение. При отключении автомата другой цепи, свет не погаснет, что позволит в более комфортных условиях устранить возникшую проблему. Практически в каждом щитке значение номинала вводного автомата меньше чем сумма на групповых.

Суммарная мощность электроприборов

Максимальная нагрузка на цепь возникает при одновременном включении всех электроприборов. Поэтому обычно, суммарную мощность вычисляют простым сложением. Однако в ряде случаев этот показатель будет меньше.

Для некоторых линий, одновременная работа всех подключенных к ней электроприборов маловероятна, а порой и невозможна. В домах иногда специально устанавливают ограничения на работу мощных устройств. Для этого нужно помнить о недопущении их одновременного включения или использовать ограниченное число розеток.

Вероятность одновременной работы всей офисной оргтехники, освещения и вспомогательного оборудования (чайники, холодильники, вентиляторы, обогреватели и т.д.) очень низка, поэтому при расчете максимальной мощности используют поправочный коэффициент

При электрификации офисных зданий для расчетов часто используют эмпирический коэффициент одновременности, значение которого берут в диапазоне от 0,6 до 0,8. Максимальная нагрузка вычисляется умножением суммы мощностей всех электроприборов на коэффициент.

В расчетах существует одна тонкость – необходимо учитывать разницу между номинальной (полной) мощностью и потребляемой (активной), которые связаны коэффициентом (cos (f)).

Это означает, что для работы устройства необходим ток мощности равной потребляемой деленной на этот коэффициент:

Ip = I / cos (f)

Где:

  • Ip – сила номинального тока, которую применяют в расчетах нагрузки;
  • I – сила потребляемого прибором тока;
  • cos (f) <= 1.

Обычно номинальный ток сразу или через указание величины cos (f) указывают в техническом паспорте электрического прибора.

Так, например, значение коэффициента для люминесцентных источников света равно 0,9; для LED-ламп – около 0,6; для обыкновенных ламп накаливания – 1. Если документация утеряна, но известна потребляемая мощность бытовых устройств, то для гарантии берут cos (f) = 0,75.

Указанные в таблице рекомендуемые значения коэффициента мощности можно использовать при расчете электрических нагрузок, когда отсутствуют данные о номинальном токе

О том, как подобрать автоматический выключатель по мощности нагрузки, написано в , с содержанием которой мы советуем ознакомиться.

Выбор сечения жил

Прежде чем прокладывать силовой кабель от распределительного щитка к группе потребителей, необходимо вычислить мощность электроприборов при их одновременной работе. Сечение любой ветви выбирают по таблицам расчета в зависимости от типа металла проводки: меди или алюминия.

Производители проводов сопровождают выпускаемую продукцию подобными справочными материалами. Если они отсутствуют, то ориентируются на данные из справочника «Правила устройства электрооборудования» или производят .

Однако часто потребители перестраховываются и выбирают не минимально допустимое сечение, а на шаг большее. Так, например, при покупке медного кабеля для линии 5 кВт, выбирают сечение жил 6 мм2, когда по таблице достаточно значения 4 мм2.

Справочная таблица, представленная в ПУЭ, позволяет выбрать необходимое сечение из стандартного ряда для различных условий эксплуатации медного кабеля

Это бывает оправдано по следующим причинам:

  • Более длительная эксплуатация толстого кабеля, который редко подвергается предельно допустимой для его сечения нагрузке. Заново выполнять прокладку электропроводки – непростая и дорогостоящая работа, особенно если в помещении сделан ремонт.
  • Запас пропускной способности позволяет беспроблемно подключать к ветви сети новые электроприборы. Так, в кухню можно добавить дополнительную морозильную камеру или переместить туда стиральную машину из ванной комнаты.
  • Начало работы устройств, содержащих электродвигатели, дает сильные стартовые токи. В этом случае наблюдается просадка напряжения, которая выражается не только в мигании ламп освещения, но и может привести к поломке электронной части компьютера, кондиционера или стиральной машины. Чем толще кабель, тем меньше будет скачок напряжения.

К сожалению, на рынке много кабелей, выполненных не по ГОСТу, а согласно требованиям различных ТУ.

Часто сечение их жил не соответствует требованиям или они выполнены из токопроводящего материала с большим сопротивлением, чем положено. Поэтому реальная предельная мощность, при которой происходит допустимый нагрев кабеля, бывает меньше чем в нормативных таблицах.

Эта фотография показывает отличия между кабелями, выполненными по ГОСТ (слева) и согласно ТУ (справа). Очевидна разница в сечении жил и плотности прилегания изоляционного материала

Расчет номинала выключателя для защиты кабеля

Устанавливаемый в щитке автомат должен обеспечить отключение линии при выходе мощности тока за пределы диапазона, разрешенного для электрического кабеля. Поэтому для выключателя необходимо провести расчет максимально допустимого номинала.

По ПУЭ допустимую длительную нагрузку проложенных в коробах или по воздуху (например, над натяжным потолком) медных кабелей, берут из приведенной выше таблицы. Эти значения предназначены для аварийных случаев, когда идет перегрузка по мощности.

Некоторые проблемы начинаются при соотнесении номинальной мощности выключателя длительному допустимому току, если это делать в соответствии с действующим ГОСТ Р 50571.4.43-2012.

Приведен фрагмент п. 433.1 ГОСТ Р 50571.4.43-2012. В формуле «2» допущена неточность, а для правильного понимания определения переменной In нужно учесть Приложение «1»

Во-первых, в заблуждение вводит расшифровка переменной In, как номинальной мощности, если не обратить внимания на Приложение «1» к этому пункту ГОСТа. Во-вторых, в формуле «2» существует опечатка: коэффициент 1,45 добавлен неправильно и этот факт констатируют многие специалисты.

Согласно п. 8.6.2.1. ГОСТ Р 50345-2010 для бытовых выключателей с номиналом до 63 A условное время равно 1 часу. Установленный ток расцепления равен значению номинала, умноженного на коэффициент 1,45.

Таким образом, согласно и первой и измененной второй формулам номинальная сила тока выключателя должна рассчитываться по следующей формуле:

In <= IZ / 1,45

Где:

  • In – номинальный ток автомата;
  • IZ – длительный допустимый ток кабеля.

Проведем расчет номиналов выключателей для стандартных сечений кабелей при однофазном подключении с двумя медными жилами (220 В). Для этого разделим длительный допустимый ток (при прокладке по воздуху) на коэффициент расцепления 1,45.

Выберем автомат таким образом, чтобы его номинал был меньше этого значения:

  • Сечение 1,5 мм2: 19 / 1,45 = 13,1. Номинал: 13 A;
  • Сечение 2,5 мм2: 27 / 1,45 = 18,6. Номинал: 16 A;
  • Сечение 4,0 мм2: 38 / 1,45 = 26,2. Номинал: 25 A;
  • Сечение 6,0 мм2: 50 / 1,45 = 34,5. Номинал: 32 A;
  • Сечение 10,0 мм2: 70 / 1,45 = 48,3. Номинал: 40 A;
  • Сечение 16,0 мм2: 90 / 1,45 = 62,1. Номинал: 50 A;
  • Сечение 25,0 мм2: 115 / 1,45 = 79,3. Номинал: 63 A.

Автоматические выключатели на 13A в продаже бывают редко, поэтому вместо них чаще используют устройства с номинальной мощностью 10A.

Кабели на основе алюминиевых жил сейчас редко используют при монтаже внутренней проводки. Для них тоже есть таблица, позволяющая выбрать сечение по нагрузке

Подобным способом для алюминиевых кабелей рассчитаем номиналы автоматов:

  • Сечение 2,5 мм2: 21 / 1,45 = 14,5. Номинал: 10 или 13 A;
  • Сечение 4,0 мм2: 29 / 1,45 = 20,0. Номинал: 16 или 20 A;
  • Сечение 6,0 мм2: 38 / 1,45 = 26,2. Номинал: 25 A;
  • Сечение 10,0 мм2: 55 / 1,45 = 37,9. Номинал: 32 A;
  • Сечение 16,0 мм2: 70 / 1,45 = 48,3. Номинал: 40 A;
  • Сечение 25,0 мм2: 90 / 1,45 = 62,1. Номинал: 50 A.
  • Сечение 35,0 мм2: 105 / 1,45 = 72,4. Номинал: 63 A.

Если производитель силовых кабелей заявляет иную зависимость допустимой мощности от площади сечения, то необходимо пересчитать значение для выключателей.

Формулы зависимости силы тока от мощности для однофазной и трехфазной сети отличаются. Многие люди, которые имеют приборы, рассчитанные на напряжения 380 Вольт, на этом этапе допускают ошибку

Как определить технические параметры автоматического выключателя по маркировке, подробно . Рекомендуем ознакомиться с познавательным материалом.

Предупреждение перегрузки от работы потребителей

Иногда на линию устанавливают автомат с номинальной мощностью значительно более низкой, чем необходимо для гарантированного сохранения работоспособности электрического кабеля.

Снижать номинал выключателя целесообразно, если суммарная мощность всех устройств в цепи значительно меньше, чем способен выдержать кабель. Это происходит, если исходя из соображений безопасности, когда уже после монтажа проводки часть приборов была удалена с линии.

Тогда уменьшение номинальной мощности автомата оправдано с позиции его более быстрого реагирования на возникающие перегрузки.

Например, при заклинивании подшипника электродвигателя, ток в обмотке резко увеличивается, но не до значений короткого замыкания. Если автомат среагирует быстро, то обмотка не успеет оплавиться, что спасет двигатель от дорогостоящей процедуры перемотки.

Также используют номинал меньше расчетного по причинам жестких ограничений на каждую цепь. Например, для однофазной сети на входе в квартиру с электроплитой установлен выключатель 32 A, что дает 32 * 1,13 * 220 = 8,0 кВт допустимой мощности. Пусть при выполнении разводки по квартире были организованы 3 линии с установкой групповых автоматов номинала 25 A.

Если количество установленных в распределительный щит групповых автоматов велико, то их необходимо подписать и пронумеровать. Иначе можно запутаться

Допустим, что на одной из линий происходит медленное возрастание нагрузки. Когда потребляемая мощность достигнет значения равного гарантированному расцеплению группового выключателя, на остальные два участка останется только (32 — 25) * 1,45 * 220 = 2,2 кВт.

Это очень мало относительно общего потребления. При такой схеме распределительного щитка входной автомат будет чаще отключаться, чем устройства на линиях.

Поэтому чтобы сохранить принцип селективности, нужно поставить на участки выключатели номиналом в 20 или 16 ампер. Тогда при таком же перекосе потребляемой мощности на другие два звена будет приходиться суммарно 3,8 или 5,1 кВт, что приемлемо.

Рассмотрим возможность с номиналом 20A на примере выделенной для кухни отдельной линии.

К ней подсоединены и могут быть одновременно включены следующие электроприборы:

  • Холодильник, номинальной мощностью 400 Вт и стартовым током в 1,2 кВт;
  • Две морозильные камеры, мощностью 200 Вт;
  • Духовка, мощностью 3,5 кВт;
  • При работе электрической духовки разрешено дополнительно включить только один прибор, самые мощный из которых – электрочайник, потребляющий 2,0 кВт.

Двадцатиамперный автомат позволяет более часа пропускать ток с мощностью 20 * 220 * 1,13 = 5,0 кВт. Гарантированное отключение меньше чем за один час произойдет при пропуске тока в 20 * 220 * 1,45 = 6,4 кВт.

На кухне постоянное подключение к электричеству должно быть у холодильного оборудования и плиты. Если существует риск превышения силы тока, то одновременную работу остальных устройств можно исключить, выделив для них всего две розетки

При одновременном включении духовки и электрочайника суммарная мощность составит 5,5 кВт или 1,25 части от номинала автомата. Так как чайник работает недолго, то отключения не произойдет. Если в этот момент включатся в работу холодильник и обе морозильные камеры, то мощность составит уже 6,3 кВт или 1,43 части номинала.

Это значение уже близко к параметру гарантированного расцепления. Однако вероятность возникновения такой ситуации крайне мала и длительность периода будет незначительна, так как время работы моторов и чайника невелико.

Возникающего при запуске холодильника стартового тока, даже в сумме со всеми работающими устройствами, будет недостаточно для срабатывания электромагнитного расцепителя. Таким образом, в заданных условиях можно использовать автомат на 20 A.

Единственный нюанс заключается в возможности увеличения напряжения до 230 В, что разрешено нормативными документами. В частности ГОСТ 29322-2014 (IEC 60038:2009) определяет стандартное напряжение равным 230 В с возможностью использования 220 В.

Сейчас в большинство сетей электричество подают напряжение 220 В. Если же параметр тока приведен к международному стандарту 230 В, то можно пересчитать номиналы в соответствии с этим значением.

Выводы и полезное видео по теме

Устройство выключателя. Выбор вводного автомата в зависимости от подключаемой мощности. Правила распределения питания:

Выбор выключателя по пропускной способности кабеля:

Расчет номинального тока выключателя – сложная задача, для решения которой необходимо учесть множество условий. От установленного автомата зависит удобство обслуживания и безопасность работы локальной электросети.

В случае возникновения сомнений в возможности сделать правильный выбор необходимо обратиться к опытным электрикам.

Пишите, пожалуйста, комментарии в находящемся ниже блоке. Расскажите о собственном опыте в подборе автоматических выключателей. Поделитесь полезной информацией и фото по теме статьи, задавайте вопросы.

Где нужно устанавливать в квартире вводной автомат, и какие лучше всего использовать – двух или трехполюстный?

Вводный автомат – это средство коммутации электричества. Какие автоматы бывают, для чего нужны, как правильно выбирать, будет написано в статье.

Как выбрать вводный автомат в квартиру – советы и рекомендации

Вводный автомат это защитное устройство в доме при использовании электрической сети. Если возникает короткое замыкание или другая аварийная ситуация, выключатель обесточит электросеть. Чтобы обеспечить безопасность, важно уметь выбирать автоматику. Ошибки расчета приведут к поломке электроприборов и даже возгоранию.

Нужен ли в квартире или в доме вводной автомат

Для защиты дома от возгорания электропроводки устанавливается вводный автоматический выключатель. Обычно его монтаж производится на лестничной площадке перед счетчиками, но также устанавливают дополнительные автоматы в квартире. Монтируется прибор в распределительной коробке и пломбируется. Доступ к общему выключателю только у электрика дома, несанкционированная попытка проникновения приведет к выплате штрафа.

Устройство и принцип работы

Внешне прибор похож на обычное защитное устройство, которое устанавливается в распределительном щитке. Главное отличие от других средств защиты – большая величина номинального тока.

Элементы:

  • соленоид;
  • биметаллическая пластинка.

При возникновении короткого замыкания стремительно увеличивается сила тока. В катушке соленоида образуется мощное магнитное поле, из-за которого сердечник втягивается внутрь и цепь разрывается.

Автоматы различаются по количеству полюсов, номинальному току, потребляемой мощности, фазности электропитания.

Время — токовая характеристика

Времятоковые характеристики автоматических вводных выключателей маркируются латинскими буквами A, B, C и так далее. К группе А относятся устройства с наибольшей чувствительностью. Далее характеристики загрубляются, и приборы класса В будут срабатывать при 3-4 кратном превышении номинального тока. Автоматика класса С и D ставится при наличии в доме мощного оборудования – электроплит, котлов, сварочных аппаратов. Точные данные в документации к автомату.

Типы

Автомат выбирается с учетом схемы электросети и ее потребностей. Выделяют однополюсные, двухполюсные, трехполюсные и четырехполюсные устройства.

Однополюсный

Выключатель с одним полюсом используется в электрических сетях с одной фазой. Разные модели отличаются разными характеристиками, от которых зависит скорость отключения. В состав входят два механизма расцепителя – электромагнитный и тепловой.

Один срабатывает при коротком замыкании, второй при превышении нагрузки в течении определенного времени. Подсоединяется через верхнюю клемму, к нижней включается отходящий провод.  Принцип действия такой же, как у отводящих автоматов, но номинал тока выше.

Двухполюсный

Используется в однофазном вводе. В конструкции блок с двумя полюсами, которые оснащены рычажками и общей блокировкой между механизмами выключения. То есть главное отличие от однополюсника в том, что при неполадке на любой из идущих от него линий, отключатся обе. Двухполюсники используются в типовых современных квартирах.

Нельзя заменить один двухполюсный выключатель двумя однополюсными автоматами! Это запрещено ПУЭ.

Трехполюсный

Для сетей на три фазы используются трехполюсники и четырехполюсники. Такие электросети есть в домах, где готовка пищи производится на электрических плитах. Для подключения трехполюсного автомата к каждой клемме подключается по фазе. В приборах с четырьмя полюсами дополнительно используется нейтральный провод.

При монтаже своими руками земля (не нейтраль) никогда не должна проходить через автомат.

Расчет автомата ввода

Перед приобретением автомата важно правильно его рассчитать.

Характеристики:

  • количество полюсов;
  • времятоковую характеристику;
  • номинальный ток;
  • установленная мощность;
  • номинальный ток утечки;
  • линейное напряжение;
  • селективность;
  • максимальный ток короткого замыкания.

Номинал тока определяется для одновременного подключения всех электроприборов в сеть. От тока зависит и мощность.

На мощные устройства, такие как водонагреватели и электрические плиты, ставятся дополнительные вводные автоматы.

Используются автоматы для систем TN-S и TN-C. В первом случае выбирается однополюсник с нулем или двухполюсник либо трехполюсник с нейтралью. Во втором случае нужен однополюсный (для сети 220 В) или трехполюсный (для 380 В) автомат.

Расчет для электросети квартиры 220 Вольт

Вводный автомат в квартиру с напряжением 220 В рассчитывается по следующей формуле:

Ip=Pp/(Uф*cosф). В этой формуле Uф – фазное напряжение, Рр – расчетная мощность, Ip – ток нагрузки. Cosф является безразмерной величиной, характеризующей наличие реактивной мощности.

Расчет для электросети квартиры 380 Вольт

Чтобы рассчитать выключатель для электросети 380 В, формула немного видоизменяется:

Ip=Pp/( Uн*cosф). Uн – это напряжение сети.

Выбирая устройство, номинальный ток следует увеличить на 10% для запаса.

Выбор ВА

Помимо основных критериев выбора есть и дополнительные. К ним относятся режим нейтрали, частота тока и величина линейного напряжения.

Режим нейтрали

Проще говоря, режим нейтрали – это способ заземления в доме. Традиционно в домах представлена система TN с различными вариациями. К наиболее распространенным относятся TN-C, TN-C-S и TN-S.

В системе TN-S имеется подводящий нулевой и рабочий провода, которые разделены от подстанции до потребителя энергии. Система TN-C представляет собой совмещенные подводящий нулевой и рабочий провода.

Частота тока

Одним из главных параметров электросети является частота тока. Это количество полных циклов изменения ЭДС (электро движущей силы) за одну секунду.

Для Российской Федерации это значение равняется 50 Гц. Проще говоря, ток 50 раз в секунду идет в одну сторону и 50 в другую проходя через нулевое значение 100 раз. Например обычная лампочка включенная в сеть с частотой 50Гц будет разгораться и тухнуть 100 раз в секунду.

Величина линейного напряжения

Для российских электросетей напряжение – фиксированная величина. Равняется 220 В или 380 В +- запас. Линейное – это напряжение между двумя фазами, которое на 60% больше, чем фазное. И соответственно = 380В.

Установка

Основной тип крепления автоматов – установка на DIN рейку. Напрямую к стене или корпусу распределительного щитка приборы не прикручиваются.

Прибор может изготавливаться в отдельном корпусе или быть установленным в общий щиток. При монтаже обязательно должен обеспечиваться доступ для электриков.

Вводный автомат должен быть опломбирован. Это обезопасит устройство от несанкционированного подключения. Ограничение доступа осуществляется при помощи заглушки на отверстиях.

Подключение снизу или сверху?

В ПУЭ сказано, что питающий кабель должен присоединяться как правило к неподвижным контактам. А у всех известных фирм неподвижные сверху.

Поэтому автомат ввода традиционно устанавливается в распределительном щите сверху слева. Для удобства отводящие линии монтируют сверху вниз . Но если смонтировать наоборот, все функции останутся такие же.

Схема включения

Входной выключатель используется не только для электробезопасности, но и для отключения потребителя от электричества при  ремонтных работах. По этой причине автомат устанавливается перед счетчиками.

Доступ к автомату имеет только профессиональный электрик. Хозяева квартир не имеют права вмешиваться в защитную систему. В 90% случаев автомат ставится в подъездный щит в многоквартирных домах и в наружные системы (столбы, заборы) для коттеджей.

Владельцы могут установить дублирующий автомат, который используется для удобства обслуживания. Он ставится между счетчиком и групповой автоматикой внутри квартирного распределительного щита. Сила тока дублирующего устройства должна быть ниже, чем на вводном приборе.

Недопустимые ошибки при покупке

Самая главная ошибка при покупке устройств для защиты – это попытка экономить, не обращая внимания на критерии автомата. Неправильно подобранный автоматический выключатель приведет к негативным последствиям.

Также нежелательно покупать автоматы неизвестных производителей. Непроверенные приборы не будут выполнять свои обязанности в полной мере, и многие характеристики часто завышены.

Все главные ошибки связаны с неправильным расчетом номиналов. Пользователь может не учесть запас по току, неправильно выбрать линейное напряжение – это приведет к неправильному результату и, как следствие, покупке неподходящего автомата.

Советы по выбору:

  1. При заключении договора абонент заказывает необходимую мощность присоединения. Исходя из этого значения, рассчитывается место установки, нагрузка и другие параметры. Самопроизвольное увеличение нагрузки недопустимо, установка более мощного выключателя должна быть согласована с соответствующими службами.
  2. Нужно ориентироваться на электропроводку. Так, если бытовая техника выдерживает ток в 30 А, а старый провод рассчитан на предельное значение в 10 А, придется заменять проводку на более мощную или отказываться от прибора.
  3. Отдавать предпочтение нужно автомату с большим током, чем рассчитанное значение. Для прибора с 14 А нужно брать выключатель на 16 А и выше.
  4. Важно обратить внимание на селективность. Номинал вводного автомата обычно равняется 40 Ампер. Для электрической плиты ставится выключатель на 32 А. Осветительная группа и розетки требуют 10 А.
  5. В загородный дом или в гараж следует выбирать мощный выключатель. Это связано с тем, что могут использоваться мощные сварочные аппараты, погружные насосы и другая техника, требующая больших токов.
  6. Лучше устанавливать автоматику от одного производителя. Риск несоответствия оборудования друг с другом будет сведен к минимуму. Также при возникновении ситуации, требующей ремонта или замены, пользователю будет проще обратиться к одному изготовителю.
  7. Покупать приборы нужно в специализированном лицензионном магазине, который имеет соответствующие лицензии и сертификаты. Это сведет к минимуму риск покупки поддельного агрегата.

Это основные требования и правила по выбору автоматических выключателей для дома и дачи. Зная их, покупатель не допустит ошибки при покупке нужного прибора.

Вводный автоматический выключатель – это обязательное устройство для защиты дома. При возникновении экстренной ситуации прибор сработает и отключит подачу электроэнергии. Автоматы различаются по количеству полюсов, номинальному току, времятоковой характеристике, режиму нейтрали, напряжению сети и другим характеристикам. Перед покупкой следует обязательно рассчитать все параметры, иначе электробезопасность обеспечена не будет. При покупке важно избегать типовых ошибок и следовать советам, которые приведены выше.

Полезное видео

номинал вводного автомата для частного дома

Какой автоматический выключатель ставить на ввод в квартиру и частный дом?

При устройстве электрической сети в частном доме или квартире важно правильно подобрать автоматические выключатели на каждую линию исходя из мощности подключаемых электроприборов. Все эти защитные устройства обычно монтируются в электрощите и обеспечивают защиту от перегрузки или короткого замыкания. Но если все эти приборы защищают линии к потребителю электроэнергии, то необходимо устройство, которое защитит группу автоматов в щите. Таким прибором является так называемый «вводной» автомат.

Назначение вводного автомата

Чтобы понять для чего же все-таки нужен «вводной «автомат», кратко разберемся что же такое автоматический выключатель в общем случае и для чего он нужен.

Автоматический защитный выключатель – контактный коммутационный прибор, который способен отключать электрические сети при возникновении внештатной ситуации (перегрузки или короткого замыкания).

Вводной автомат по внешнему виду, механизму работы и конструкции ничем не отличается от обычного защитного устройства, контролирующего какую-либо электрическую линию. Единственное и самое важное отличие – это его номинал, который на определенный (рассчитанный) порядок выше, с учётом селективности, чем у любого линейного защитного выключателя в электрощите.

Вводной автомат обязательно устанавливают при вводе электрического кабеля в квартиру или частный дом. Он защищает в целом всю электрическую сеть жилого помещения от перегрузки, а также служит для отключения питания на всем объекте (например, для проведения электротехнических и других ремонтных работ). Также он обеспечивает правильную работу подводящего электрокабеля и не позволяет превышать нагрузку, установленную для данного помещения.

Основные критерии выбора

Для того чтобы правильно подобрать вводной автомат (ВА) нужно знать на какие характеристики стоит обратить внимание при покупке.

Номинальный ток

Это самая важная характеристика при выборе вводного защитного устройства. Это свойство прибора обозначает максимальный ток, при превышении которого произойдёт отключение питания, за определённое время.

Обратите внимание! Автоматические выключатели служат для защиты кабеля от перегрева и номинал должен быть подобран с учётом площади сечения проводников!

Вне зависимости от того, является автомат вводным или обеспечивающим защиту конкретной линии (провода), его расчёт производится по максимальной мощности потребителей электроэнергии. Номинал вводного устройства выбирают, рассчитывая мощность (или ток) всех потребителей при одновременном включении в сеть, для большей безопасности уменьшая полученное число на 10-15%, округляя в сторону меньшего значения.

Количество полюсов

Существуют автоматы с разным количеством полюсов. Однополюсные применяют для защиты отдельных линий. Функции вводного автомата обычно выполняют двух, трех или четырехполюсные автоматические выключатели.

Важное правило, которое поможет выбрать количество полюсов заключается в том, что для однофазных сетей применяют двухполюсные автоматы, а для трехфазных – трех или четырехполюсник.

Двухполюсные выключатели выполнены с общим для обоих полюсов рычагом и механизмом отключения. То есть при аварийной ситуации происходит отключение сразу двух полюсов (обычно к одной клемме подключают фазу, ко второй — ноль). Такие приборы часто применяются в однофазных сетях жилых помещений многоквартирных домов.

Трехполюсный (или четырёхполюсный) автомат используют при вводе электрического кабеля в частные дома при трехфазной сети, а также в промышленных зданиях и даже в некоторых квартирах. К каждой клемме прибора подключают по фазе (и ноль, если это четырехполюсник). Он также, как и двухполюсник имеет один общий рычаг для всех полюсов и при перегрузке отключает питание по всем фазам.

Времятоковая характеристика

Характеризует ток мгновенного расцепления и чаще всего обозначается на приборе латинскими буквами B, C или D. От времятоковой характеристики зависит чувствительность защитного устройства к пусковым токам электроприборов и оборудования. Для вводного автоматического выключателя это свойство является важным, так как оно влияет на срабатывание нижестоящих групп автоматов.

Чаще всего используют следующие типы автоматов по времятоковой характеристике:

Для вводного автомата в жилые помещения применяют устройства с времятоковой характеристикой типа C, так как большинство приборов в домашних условия не имеют больших пусковых токов и не будут оказывать негативного влияния на электрическую сеть квартиры или дома.

Характеристики срабатывания каждого устройства указываются в паспорте и инструкции завода-изготовителя автоматического выключателя.

Способ крепления

Все автоматические выключатели имеют стандартное крепление и помещаются на дин-рейку в электрощите. Это же правило относится и к вводным автоматам. Исключение составляют специальные устройства для промышленных целей, которые могут закрепляться без дин-рейки на специальные крепления.

Бренд выключателя

При выборе вводного защитного выключателя, также как и в случае выбора любых электротехнических устройств важно ориентироваться на известного производителя, заслужившего признание. Такие производители дают гарантию качества на свои устройства и изготавливают надежные, долговечные и безопасные автоматические выключатели. К самым популярным на сегодняшний момент относятся автоматы следующих производителей:

Расчёт номинала вводного автоматического выключателя

Работоспособность устройств и безопасность электрической сети в жилом доме или квартире напрямую зависит от правильного выбора автоматических выключателей, в том числе вводного устройства. Чтобы рассчитать номинал вводного автомата нужно обладать некоторыми электротехническими знаниями.

Для частного дома 380 В 15 кВт

Чтобы произвести расчет вводного автомата для частного дома, необходимо учесть следующие значения: напряжение в сети (U), мощность (P) всех электрических приборов, которые будут работать в сети, поправочный коэффициент, который учитывает одновременное включение электроприборов и качество электропроводки.

Пример расчета:

Допустим, что сумма мощностей всех электроприборов в жилом доме составляет 15 кВт (эта же мощность в России обычно подводится к частным жилым зданиям) при напряжении 380 В. Чтобы рассчитать ток, используем Закон Ома для электрической цепи:

I=15000/380 = 39, 47 A.

Вводим поправочный коэффициент. Так как все электрические приборы в доме одновременно включаться не будут и, учитывая старую электропроводку, принимаем значение поправочного коэффициента равное 0,85.

Iн=39,47х0,85 = 33,55.

Ближайшие по номиналу значения автоматов: на 32 А и на 40А. Выбираем номинал в наименьшую сторону. И получаем, что для нашего частного дома необходим вводной трехполюсный или четырехполюсный автомат на 32 А.

Для квартиры 220 В

Для квартир с напряжением 220 В расчет вводного автомата аналогичен выбору автомата для частного дома. Единственное различие заключается в том, что изменится мощность и напряжение сети.

Пример расчета:

Допустим, что сумма мощностей будет равняться 10 кВт, поправочный коэффициент примем 0,85, а напряжение, как мы уже знаем, равно 220 В. Тогда:

Iн=10000/220*0,85= 45,45х0,85 = 38,63.

Исходя из полученного значения и округляя номинал к наименьшему, выбираем автоматический выключатель 32 А.

Схема подключения вводного автомата

Принципиально, монтаж и подключение вводного автомата практически ничем не отличается от установки обычного автоматического выключателя. Такой автомат монтируется на дин- рейку и подключается до счетчика (с обязательным опломбированием) или после. Далее от него уже монтируются остальные автоматы для защиты каждой линии жилого помещения.

Недопустимые ошибки при покупке

Самыми распространенными ошибками при выборе и покупке вводного автоматического выключателя являются незнание принципов его работы и выбор номинала автомата ниже или выше требуемого значения. Если выбрать автомат ниже номиналом, то возможно ложное срабатывание защиты и отключение всей квартиры из-за одного прибора. При выборе номинала выше необходимого значения, он может сработать уже после того, как изоляция проводов, либо устройства внутри электрощитка перегреются и начнут плавиться или гореть.

Также находятся «профессионалы», которые подключают вместо двухполюсника два однополюсных автомата, не зная о том, что это нарушает требования электробезопасности и ПУЭ запрещает такое подключение.

Если есть сомнения в выборе и монтаже такого прибора, стоит обратиться к профессиональному электрику и быть спокойным за правильный выбор и безопасный монтаж.

Как выбрать автоматический выключатель по мощности и току нагрузки?

Чем отличается УЗО от дифавтомата

Что такое дифференциальный автомат?

Почему при включении или во время работы стиральной машины выбивает пробки, УЗО или дифавтомат

Как собрать электрический распределительный щиток для квартиры

Источник

Электрический щиток в частном доме: комплектация и последовательность подключения оборудования

Осуществляя подключение частных домов к внешней системе электроснабжения, собственники жилья сталкиваются с различными проблемами и ошибками:

Вызвано все это отсутствием объективной информации о том, как правильно подводить электричество к дому и каким оборудованием следует оснащать вводной электрический щиток.

Точнее, на существующие вопросы можно найти много ответов, но не так просто обнаружить в них достоверные сведения.

Правила устройства электроустановок ПУЭ, строительные нормативы, требования местных электросетевых компаний – если вникать во все это одновременно, можно быстро зайти в тупик. Поэтому мы хотим вас познакомить с реальным опытом пользователей FORUMHOUSE и рекомендациями специалистов Группы Legrand, наших партнеров в проекте «ДОМ ЗА ГОД» с FORUMHOUSE.

Подключение энергопринимающего оборудования в частном доме – это вопрос, решением которого должны заниматься профессионалы. Тем не менее, прочитав статью, вы сможете взять на заметку несколько рекомендаций лично для себя.

Сегодня вы узнаете:

Организация точки ввода

В процессе подключения от уличного щита учета электроэнергии (ЩУ), расположенного на отводной опоре ЛЭП, к распределительному щитку (РЩ), смонтированному в помещении, ведется кабельная линия (подземная или воздушная).

В щите учета (ЩУ), зачастую, находится только вводной автомат и прибор учета электроэнергии. В распределительный щиток (РЩ), который устанавливается непосредственно в доме, монтируются автоматы защиты, устройства защитного отключения и другие элементы, о которых речь пойдет ниже.

В отдельных случаях оборудование для ЩУ и РЩ может быть установлено в одном корпусе.

Рабочие параметры оборудования, устанавливаемого в щиток учета, его перечень и количество – все это должно быть прописано в проекте электроснабжения (или, по крайней мере, должно быть рассчитано профильными специалистами). Но есть требования, которые предъявляются непосредственно к конструкции электрического щита.

Конструкция электрического щитка должна обеспечивать удобство подвода питающего кабеля, в нем должны присутствовать нулевые шины и шины заземления. При этом электрический щит должен обладать внутренним пространством, достаточным для размещения многочисленных отходящих кабелей, и его запасом, необходимым для возможного расширения и модернизации электроустановки.

Добавим, что корпус щитка должен быть устойчив к воздействию огня или быть изготовлен из самозатухающего материала. При этом он обязан надежно защищать встроенное оборудование от возможных повреждений. Против предумышленных повреждений поможет встроенный в дверь или ручку щитка замок, а защиту от воздействия пыли и влаги гарантирует указанная в спецификации степень защиты IP. Если щиток предполагается установить на улице или в помещении, где необходима повышенная защита от влаги, пыли и механических повреждений, то лучше отдать предпочтение щиткам класса IP65 –IK09.

Если точка подключения организована в соответствии с требованиями согласованного электропроекта, проблем в процессе подключения и дальнейших проверок со стороны контролирующих организаций у владельца участка, как правило, не возникает. Следовательно, труд, связанный с установкой и комплектацией электрического щитка, не окажется напрасным.

Вводной выключатель и прибор учета

Начальной точкой домашней электроустановки считается вводной выключатель, к которому подключается электросчетчик, и остальные устройства, расположенные после прибора учета.

Номинал вводного АВ определяется энергоснабжающей организацией, исходя из выделенной мощности. Например, при трехфазном вводе и 15 кВт выделенной мощности номинал – 25А. При 1-фазном вводе и 7,5 кВт номинал – 40 А. При этом, если мощность более 11 кВт, электроснабжение должно быть трёхфазным. При наличии в проекте трёхфазных потребителей допускается трёхфазное подключение при выделенной мощности менее 11 кВт.

Устройство ввода резерва

Если в состав электроустановки входит источник автономного электроснабжения (например, дизельгенератор), то система должна иметь устройство ввода резерва, которое устанавливается после прибора учета электроэнергии. Речь идет о переключателе, позволяющем в ручном режиме подсоединять потребителей к генератору или к внешней системе электроснабжения. Данное устройство не позволяет одновременно задействовать два разных источника питания (трансформаторную подстанцию и дизельгенератор). В этом и состоит его ключевое преимущество.

УЗИП

Чтобы защитить электроустановку от высоковольтных импульсов, от последствий прямого удара молнии и, как следствие, от возможных пожаров, в систему необходимо интегрировать устройство защиты от импульсных перенапряжений (УЗИП).

На общей схеме УЗИП располагаются сразу после вводного аппарата QF1. Кроме того, УЗИП следует подключать к схеме через отдельный аппарат защиты QF2 (автоматический выключатель или предохранитель). Число полюсов вводного аппарата и УЗИП следует выбирать исходя из количества фаз и режима работы нейтрали. (см. схему). При воздушном вводе в здание установка УЗИП – обязательна!

Противопожарное УЗО

Противопожарные устройства защитного отключения призваны защищать от пожара. В качестве противопожарных УЗО используются устройства, срабатывающие на номинальный дифференциальный ток – от 100 до 300мА. Это довольно большая уставка, и она не позволяет защитить человека от поражения электрическим током. По этой причине отдельные группы потребителей оснащаются дополнительными (более чувствительными) УЗО.

В последнее время широкое распространение получили селективные противопожарные УЗО.

Тип «S» (селективное УЗО с задержкой срабатывания) – предназначено для того, чтобы при замыканиях на землю в линиях (например, в линиях розеток) срабатывали только нижестоящие УЗО конкретной линии, а противопожарное УЗО на вводе продолжало работать, питая исправные участки электропроводки.

Кросс-модуль

В современных системах электроснабжения часто используется несколько групп электрических потребителей (розеточная группа, осветительная и т. д.). И для того чтобы между различными группами распределить электроэнергию, поступающую в щиток от вводного кабеля, на DIN-рейку рекомендуется устанавливать модульный распределительный блок (кросс-модуль). Кросс-модуль позволяет ввести в щиток один проводник, рассчитанный на большую нагрузку, и получить на выходе несколько линий меньшего сечения (которое зависит от нагрузки на ту или иную группу потребителей).

Помимо этого, установка кросс-модуля обеспечивает надежность электрических соединений и упрощает процесс подключения дополнительных устройств к уже действующему электрическому щиту.

УЗО и автоматические выключатели (АВ) для отдельных групп

Каждая линия потребителей, выходящая из кросс-модуля, защищается отдельными автоматами и УЗО. Когда речь заходит об их установке в распределительный щиток, сразу возникает два вопроса:

Постараемся дать на них развернутые ответы. Для начала давайте выясним, какие функции выполняют представленные устройства:

В основе защитного действия УЗО лежит принцип ограничения (за счет быстрого отключения) продолжительности протекания тока через тело человека при непреднамеренном прикосновении его к элементам, находящимся под напряжением. При нормальных условиях ток, протекающий по нейтральному проводу, точно равен току в фазном проводе. Если между ними возникает разница из-за утечки на землю через поврежденную изоляцию или через тело человека, то прибор реагирует на это немедленным отключением сети.

Чтобы понять, каким номиналом должны обладать аппараты защиты, обратимся к мнению специалиста.

Розеточные линии (сечение кабеля 2,5 мм²) защищаются АВ на 16А, линии освещения (сечение кабеля 1,5 мм²) АВ на 6 или 10 А. Потребители мощностью более 3,5 кВт подключаются к щиту отдельным кабелем через отдельный АВ. Сечение кабеля и номинал АВ в этом случае нужно рассчитывать.

На корпус АВ всегда наносится буквенное обозначение категории устройства по току срабатывания (например, B16, C16). Цифра, стоящая после буквы, обозначает номинал устройства в амперах. В бытовых системах используются АВ следующих категорий: «В» и «С». Устройства категории «B» срабатывают практически мгновенно при увеличении тока в цепи до 3–5 номиналов. Устройства категории «C» рассчитаны на мгновенное отключение при 5–10 номиналах. Следовательно, автоматы категории «В» наиболее чувствительны к токам короткого замыкания и особенно рекомендуются для деревянного домостроения.

Теперь, что касается УЗО: эти устройства выбирают сразу по трем параметрам:

УЗО на 30 мА ставят «во главе» группы автоматических выключателей (например, 3-4 автомата подключаются к одному УЗО). Номинальный ток УЗО при этом должен быть не меньше, чем у вышестоящего АВ (как правило, вышестоящим является вводной АВ).

Итак, к каждому УЗО можно подключать несколько АВ, защищающих отдельные группы потребителей.

Проще говоря, само УЗО находится под надежной защитой, если до или после устройства в цепь включен АВ, номинал которого меньше или равен номиналу УЗО.

И еще о номинале УЗО.

Помещения с высоким уровнем влажности (ванные комнаты, душевые) рекомендуется защищать УЗО с дифференциальным отключающим током – 10 мА, если на них выделена отдельная линия. В остальных случаях, например, если одна линия выделена на несколько помещений (кухня, ванная и т. д.), следует использовать УЗО с дифференциальным током срабатывания – не более 30 мА (СП 31-110-2003).

Последовательность подключения УЗО и автоматических выключателей

Первое правило подключения: если фаза взята с одного УЗО, то ноль от всех потребителей, подключенных к данной фазе, должен возвращаться на исходное УЗО. То есть нулевой и фазный провода не должны после УЗО смешиваться с другими нулями и фазами.

На схеме мы видим два автомата, идущие на осветительные группы (защита осветительных линий с помощью УЗО обязательной не является). Противопожарное УЗО на данной схеме не обозначено. Розеточные группы защищены защитным отключением, имеющим номинал – 40 А и 30 мА.

Подключение выполнено просто:

Во время комплектации электрических щитов следует избегать ситуаций, при которых к одному УЗО подключается неограниченное количество линий. Для обеспечения этого условия стандартный щиток оснащается несколькими устройствами защитного отключения. УЗО в данном случае группируются по типам подключаемых помещений и по видам нагрузки. Например, розеточная группа ванной комнаты подключается к УЗО номиналом – 10 мА, а розеточные группы кухни и жилых помещений подключаются к УЗО номиналом – 30 мА.

Дифференциальные автоматы

На практике, вместо устройств защитного отключения часто применяются дифференциальные автоматы.

Это устройства, совмещающие в одном корпусе УЗО и АВ. Применять дифавтоматы имеет смысл, если данное устройство будет защищать отдельную линию или отдельного потребителя. Если дифавтоматом защищать несколько линий, то на каждую понадобится дополнительно устанавливать свой АВ (если, конечно, для вас важна селективность системы, и вы не желаете ее нарушать).

Источник

На сколько ампер ставить вводной автомат в частный дом

Применение защитного оборудования очень важно при использовании электрических сетей. Вводной автомат является частью защитной системы. При возникновении короткого замыкания или отклонениях в работе электроприборов, а также нарушении изоляционного слоя проводов может возникнуть опасность возгорания или вероятность поражения живого организма электрическим током.

Принцип работы и типы автоматов

Для защиты проводов применяется автоматический выключатель, а для защиты от поражения электрическим током — устройство защитного отключения (УЗО). В качестве вводного автомата УЗО не применяется, а вместо него используется дифференциальный автомат — устройство, объединяющее в себе функции обычного автоматического выключателя и УЗО. Применение вводного автомата в квартире позволит обесточить всю электросеть при возникновении аварийного режима автоматически или одним нажатием вручную.

Вводной автоматический выключатель может быть разного типа. Для того чтобы правильно выбрать какой тип и вид нужен для защиты линии в квартире или частном доме, потребуется понимать принцип его работы и знать основные характеристики. Характер работы вводного устройства заключается в автоматическом одновременном разрыве как фазовых, так и нулевых проводов при возникновении аварийной ситуации на линии электросети. Устанавливается он последовательно электрической цепи в после подключения электросчётчика.

Это обусловлено тем, что вся линия до счётчика, как и он сам, принадлежит энергоснабжающей компании, и любого вида вмешательство в неё запрещены. Вводные автоматы до счётчика ставятся, в первую очередь, энергопоставляющими компаниями для того, чтобы ограничить потребление электроэнергии пользователями. Их опечатывают так же, как и счётчик.

Автоматический выключатель

Работа устройства основана на способности разрывать электрическую цепь при достижении пропускаемой через него мощности критической величины. В качестве основных элементов конструкции выделяют:

Элементы конструкции подключены последовательно и составляют блок расцепителя. Ток, проходя через катушку соленоида, попадает на пластинку, а далее на выходные клеммы. Пластинка изготавливается из металлов с различным тепловым сопротивлением, и при нагреве изгибается.

Увеличение потребляемой мощности цепи в случае возникновения неисправностей электроприборов или при подключении особо мощного устройства приводит к её нагреву. Пластина изгибается и разрывает контакт. Величина тока, при котором разрывается контакт, настраивается в заводских условиях. В режиме короткого замыкания сила тока возрастает стремительно, в катушке соленоида возникает мощное магнитное поле, благодаря которому сердечник втягивается внутрь соленоида, разрывая контакт.

Дифференциальный выключатель

Объединяет функции автоматического выключателя и УЗО. Дополнительно к расцепителю в его конструкции устанавливается трансформатор тороидального типа. Работа устройства основана на способности электродвижущей силы (ЭДС) наводить ток в проводнике. При прохождении тока по обмоткам трансформатора в каждой из них появляется магнитный поток. Он равен по величине, но разный по направлению, поэтому результирующая сила в сердечнике равна нулю.

При утечках тока равенство в магнитных потоках нарушается. Во вторичной обмотке возникает ЭДС, появляется ток. Контакты вторичной обмотки трансформатора подключены к управляющим выводам реле. При появлении напряжения происходит срабатывание реле и электрическая цепь разрывается.

Характеристики вводного устройства

Характеристики во многом помогают определить, какие автоматы ставить в частном доме или квартире. Основные параметры, на которые обращают внимание, следующие:

Критерии выбора устройства для дома

В первую очередь необходимо рассчитать мощность требуемого устройства, т. е. номинальную силу тока. На сколько ампер ставить автомат в доме, вычисляется путём суммирования мощности всей планируемой нагрузки, которая может быть включена одновременно в цепь. Например, в доме имеется нагревательный бойлер на 2200 ватт, стиральная машинка — 600 ватт, пылесос — 250 ватт, компьютер — 350 ватт, телевизор — 100 ватт, утюг — 400 ватт, освещение с потреблением энергии на 800 ватт, и всё это может быть включено одновременно.

Вычисляется общая мощность, P = 2200+600+250+350+100+400+800 = 4700 ватт. Пусть сеть используется однофазная, с величиной напряжения 220 вольт. Максимальная сила тока будет равна Imax = 4500/220 = 21 ампер. Таким образом, нужен автомат с величиной номинального тока 25 A. Когда выбирается трёхфазный вводной автомат для частного дома, сколько ампер понадобится при использовании сети 380 вольт вычисляется аналогично. Для примера выше Imax = 4500/380 = 11 ампер. Автомат выбирается на 13 А.

Вводный автомат выбирается больше, чем полученное значение, так как если выбрать c меньшей величиной, то при включении дополнительного устройства выключатель разорвёт электрическую цепь. Следует учитывать, что оборудование, использующее в своей работе двигатели, в момент включения потребляет пиковую мощность.

При подборе автомата надо учитывать не только планируемую суммарную мощность подключаемых приборов, но и качество, а в первую очередь сечение, проложенной электропроводки. Сечение используемого провода характеризует величину тока, которую может пропустить через себя проводник без ухудшения своих электрофизических свойств. Например, медный провод сечением 2,5 мм/2 выдерживает продолжительную токовую нагрузку в 27 ампер. Поэтому применять автомат на 32 A при таком сечении нельзя.

Если в качестве вводного выключателя используется дифференциальный автомат, то потребуется ещё выбрать значение номинального тока утечки. Оно выбирается в диапазоне 100—300 mA. Если выбрать меньше, возможны ложные срабатывания.

Следующим этапом будет выбор количества полюсов и токовой характеристики. С количеством полюсов всё просто: если линия двухпроводная на 220 вольт, ставится двухполюсный, а когда электрическая линия имеет два фазовых провода и её значение 380 вольт, то трёхполюсный. На токовую характеристику влияет длина линии, т. е. расстояние от выключателя до максимально удалённой розетки или осветительного прибора. Сам расчёт сложный, но учитывая, что в квартирах и частных домах длина линии не превышает 300 метров, выбирается вводное устройство всегда с характеристикой C.

Наиболее популярными производителями, зарекомендовавшими себя по всему миру и выпускающие качественные устройства, являются ABB, Legrand, Schneider Electric, Siemens, Moeller.

Источник

Вводной автомат: общие сведения, место расположения, типы, как выбрать

При обустройстве электрической сети жилого строения обязательно обеспечивается высокий уровень безопасности путем установки защитного оборудования. Одним из таких важных элементов является вводной автомат. Читайте и будете знать, что собой представляет такое устройство. Рассмотрим конструктивные особенности, существующие типы, нюансы выбора, согласования с энергосбытом и установки дублирующего аппарата.

Автомат в электрощитке на вводе линииИсточник slavasozidatelyam.ru

Общие сведения

Многие домовладельцы не знают разницы между автоматом, монтируемого на вводе электросети в строение, и защитным выключателем, который срабатывает в автоматическом режиме. Если оборудование рассматривать со стороны технического устройства, то разницы между ними никакой нет. Оба элемента устанавливаются, чтобы без участия человека отключать электрическую сеть, когда она перегружена или при возникновении замыкания.

Вводной автомат для частного дома и выключатель автоматического действия различаются исключительно своим назначением. Они подключаются по разным схемам. Групповой или обычный защитный автомат может устанавливаться на одну или сразу несколько электролиний. При этом устройство на вводе используется, чтобы подключать к сети или отключать от электричества полностью весь дом. В то же время внешне данный элемент ничем не отличается от обычного автоматического защитного выключателя.

Место установки автомата ввода

Перед выбором и непосредственно монтажом определяется место установки устройства. Чтобы не ошибиться, нужно руководствоваться правилами устройства электроустановок. Сокращенно они называются ПУЭ.

Седьмое издание ПУЭИсточник rukipro.ru

В 7 пункте этих правил сказано, что замена электрического счетчика должна осуществляться после отключения электролинии, к которой он подсоединен. Обесточивание выполняется путем установки коммутационного аппарата. С его помощью снимают напряжение с каждой фазы. Их отключение позволит безопасно выполнить требуемые работы.

В соответствии с установленным правилом вводной автомат перед счетчиком обязательно устанавливается на каждом объекте. Ведь он является одним из видов коммутационных электрических аппаратов. Кстати, к ним также относятся рубильники и пакетные выключатели. При этом монтаж всех таких устройств должен осуществляться не дальше 10 м от электросчетчика. Данное расстояние актуально для сетей с напряжением до 380 В.

Выключатель защитный перед устройством учета энергииИсточник chelny.bitu.ru

Конструктивные особенности

Перед тем как решить, какой автомат ставить на ввод в частный дом, требуется познакомиться с его конструкцией. Устройство производится в пластмассовом корпусе. Он закрывает два механизма включения. Один из них имеет подвижную конструкцию, а другой – представляет собой неподвижный контакт. Если взводная рукоятка поднята вверх, тогда происходит их замыкание. В таком состоянии она фиксируется, и автомат считается включенным.

В конструкции устройства имеется два защитных элемента. Они создают цепь для протекания электрического тока. Одним из элементов является биметаллическая пластина. Ее срабатывание происходит, когда превышается температурный порог и значение тока. Второй защитный элемент – электромагнитный расцепитель. Его размыкание происходит, когда возникает короткое замыкание.

Конструкция защитного автоматаИсточник elektrik-a.su

Маркировку имеет каждый вводной автомат для частного дома – сколько ампер это устройство способно выдержать из нее не трудно узнать. На корпусе всегда указывается допустимое значение силы тока. При постепенном увеличении такой величины происходит нагрев пластины. Это приводит к механическому размыканию контактов.

Если же происходит короткое замыкание, которому характерно лавинообразное повышение силы тока, тогда сработает второй расцепитель – электромагнитный элемент. Когда в доме установлено многополюсное защитное автоматическое устройство и значение параметра превышает допустимую величину на любой из линий – отключаются все контакты в пакете.

Независимо от причины срабатывания автомат остается в выключенном положении. Он не способен самостоятельно включиться. Для перевода в рабочее состояние человеку нужно поднять его рукоятку.

Типы автоматов

Производители изготавливают вводные аппараты в одно, двух, трех и четырехполюсном исполнении. Разновидность зависит от схемы электрического питания жилого строения. Поэтому ее нужно знать перед тем, как выбрать вводной автомат.

Разнополюсные защитные аппаратыИсточник izion.pro

Автомат с одним полюсом

Такой тип вводного выключателя применяется в электрической линии с одной фазой. Для подключения к кабелю, проложенному до объекта, используется в устройстве верхняя клемма. Нижний аналогичный элемент применяется для соединения с проводом, который прокладывается к счетчику и дальше по постройке.

Монтаж однополюсного автомата выполняется на фазном проводе. Это позволяет снять с жилы напряжение, когда возникает нештатная ситуация. Конструктивно он не отличается от аппаратов на отводящих электролиниях. Однако вводной защитный выключатель всегда способен выдержать больший электроток.

Схема установки такого устройства подразумевает подсоединение к нему питающей фазы. Потом она прокладывается к электросчетчику. Затем ее ведут до групповых автоматических выключателей. От них она уже расходится по всему объекту.

Нейтральный провод сразу подводят к электросчетчику. Затем ноль соединяется с шиной в щитке. Потом нейтраль прокладывают до потребителей – розеток, лампочек и так далее.

Однополюсный защитный выключатель устанавливается на фазном проводеИсточник vitrina59.ru

Использование входного выключателя позволяет защитить вводной кабель от чрезмерного нагрева. При появлении короткого замыкания во внутридомовой электролинии отключается аппарат, который установлен именно на ней. В других помещениях и частях дома электричество не пропадает. Использование этой схемы позволяет за короткий промежуток времени найти причину обесточивания конкретной линии.

Важно! На вводной автомат для частного дома 220в и 380 В обязательно устанавливается пломба инспектором Энергосбыта.

Доступ к контактным группам аппарата ограничивают разными способами. Каждый из них позволяет предотвратить незаконное подключение к электросети. Иногда устанавливают заглушки. Их ставят на отверстия, которые используют для затягивания контактных групп. Часто также пломбы устанавливают на крышки, защищающие контакты. Пломбы не должны мешать обесточивать объект и включать электричество.

Автомат с двумя полюсами

Эта разновидность устройства изготавливается в виде блока с двумя полюсами. В конструкции присутствует общий рычаг. Механизмы отключения двухполюсника объединены. Поэтому он имеет общую блокировку.

Двухполюсный защитный выключательИсточник torgmarket.by

В соответствии с ПУЭ нельзя разрывать нейтральную жилу электрического кабеля. При этом запрещается устанавливать вместо двухполюсного автомата два однополюсных устройства. Поэтому двухполюсник применяют в однофазной, но в двухпроводной сети. Он позволяет гарантированно отключить объект, если случайно буду перепутаны жилы кабеля. Другими словами, фазный провод окажется на шине, а нейтраль на входном автоматическом выключателе.

Сейчас в основном прокладывают кабели с тремя жилами. Это нейтральный провод, земля и фаза. В таком случае двухполюсный автомат перед счетчиком в частном доме тоже гарантированно отключит объект при возникновении нештатной ситуации. Кроме того, его рекомендуется применять в старых домах, где ранее были установлены пробки на нулевом и фазном проводе.

Схема с двухполюсником на вводеИсточник twimg.com
Важно! В соответствии с действующими правилами не разрешается монтировать предохранители на нейтральных проводах.

В таком случае использование двухполюсного автомата максимально упрощает задачу. Ведь не придется переделывать электрическую схему. Кроме того, такое устройство обязательно необходимо использовать, если частный дом подключается по схеме ТТ. Его применение позволит снизить вероятность образования разности потенциалов, которые возникают между нейтралью и землей.

Автомат с тремя полюсами

Перед принятием окончательного решения относительно того, какие автоматы ставить в частном доме, нужно обязательно выяснить фазность электрической сети. Если она трехфазная, тогда устанавливается автомат с тремя полюсами. Использование такого устройства позволяет сразу обесточить все фазы. Он защитит электрическую систему от перегрузок и внутрисетевых коротких замыканий.

Трехполюсный защитный выключательИсточник emi61.ru

Трехполюсник имеет по три клеммы в верхней и нижней части. Конструкция этого устройства подразумевает наличие в каждом контуре отдельной биметаллической пластины и электромагнитного расцепителя. В автомате также присутствует три дугогасящих камеры.

Вводной автомат 3 фазы тоже всегда устанавливается перед электросчетчиком. Однако часто дополнительно в электрической схеме дома используют УЗО. В этом случае его обязательно монтируют после счетчика. Необходимость его установки связана с большой длиной проводов по всему дому. Это увеличивает вероятность утечки электротока.

Вводная трехфазная электрическая сеть после УЗО обычно разделяется на отдельные линии к потребителям. Ее также делят на отдельные группы для подачи электричества, например, в хозяйственный блок, гараж, мощному оборудованию и так далее.

Схема с трехполюсным защитным выключателем на вводеИсточник uk-parkovaya.ru

Выбор по силе тока

Перед тем как решить, какие автоматы выбрать для частного дома, необходимо рассчитать суммарную нагрузку. Ведь через эти устройства будет проходить весь ток, который используется в любой точке постройки. Для вычисления суммарной нагрузки не требуется особых знаний. Необходимо лишь знать точное количество потребителей электричества в жилом строении.

Однако суммарная мощность всех электрических приборов может оказаться очень большой. Ведь в современных домах используется огромное количество различного электрооборудования. В такой ситуации рекомендуется учитывать мощность только тех электроприборов, которые будут одновременно работать.

Так, предположим, что в небольшом частном доме постоянно включен холодильник, телевизор, персональный компьютер и, возможно, кондиционер. Дополнительно в любой момент человеку еще может понадобиться воспользоваться бойлером, духовым шкафом или утюгом. Это уже более мощные электрические приборы. Однако при расчете обычно учитывают только один из них.

Возможные потребители электричества в домеИсточник mogilev.mchs.gov.by

Если рассматривать дом с таким количеством электрических приборов, то суммарное значение будет не более 5 кВт даже с освещением. Хотя сегодня все чаще домовладельцы предпочитают использовать лампы в экономичном исполнении – энергосберегающие источники света.

На заметку! Ранее в люстры устанавливали только лампы накаливания. Для полного освещения двух комнат тратилось примерно от 500 до 700 Вт. Однако в жилом доме свет постоянно используется и в других помещениях. Поэтому всем домовладельцам рекомендуется устанавливать в осветительные приборы энергосберегающие лампы.

Перед тем как окончательно определиться, какие автоматы ставить в частном доме 220в, рекомендуется предусмотреть запас по мощности. Ведь нередко в жизни случаются непредвиденные ситуации, когда приходится одновременно включать большое количество электрических приборов. Поэтому обычно делают запас в размере от 20 до 30%.

Одновременное включение большого количества электрических приборовИсточник oofgrid.com

Увеличенный номинал вводного автомата позволит каждый раз не восстанавливать энергоснабжение дома, если одновременно включены несколько мощных электрических приборов. В нашем примере суммарное значение будет уже не 5 кВт, а 6,5 кВт. В соответствии с законом Ома, чтобы узнать потребляемую силу тока, нужно мощность с запасом поделить на 220 В. В результате получается примерно 30 А.

Важно! При наличии трехфазной электрической сети деление выполняется на 380 В.

Производители не выпускают защитные выключатели, рассчитанные на такую силу тока. Поэтому решая, на сколько ампер ставить автомат в дом, выбирают устройство с ближайшим большим значением – это 32 А.

Номинальные значения тока автоматических выключателейИсточник malolikto.ru
Сборка и монтаж распределительного щита в квартире или частном доме

Однако это только пример расчета номинального тока автоматического выключателя. С ростом суммарной нагрузки на конкретном жилом объекте выбирают автомат с более высокой такой характеристикой. При этом для полноценного и безопасного использования электричества потребуется прокладка в здании мощной электрической проводки.

Кроме того, домовладельцу придется больше заплатить энергоснабжающей организации за согласование подключения. Ведь тарифы напрямую зависят от киловатт. На их количество влияет площадь объекта, присутствие на частной территории хозяйственных строений, использование электрического инструмента.

Важно! Обычно в частной жилой постройке устанавливают входной автомат, который способен выдержать ток 63 А.

Значение рабочего тока также можно вычислить, если умножить суммарную мощность в киловаттах на 4,55. Этот коэффициент актуален, когда напряжение в электрической сети составляет 220 В. Если же рабочее напряжение равно 380 В, тогда суммарную мощность подключенных электроприборов умножают на 1,52.

Как вычисляется номинальный ток защитного выключателя рассказано в видео:

Оба способа вычисления номинальной силы тока актуальны и позволяют понять, на сколько ампер ставить вводной автомат в частном доме. Эти методы вычисления обычно используют, когда на все фазы приходится одинаковая нагрузка. Если же она разная, тогда расчет выполняют по наибольшей величине.

Подбор по фазности

Фазность электрической сети обязательно учитывается, когда подбирается автомат и решается, сколько он должен выдерживать ампер. Обычно при наличии только одной фазы выполняют монтаж защитного выключателя на два полюса. Если же сеть трехфазная, тогда осуществляют установку трех- или даже четырехполюсного устройства.

Однофазная сеть с двухполюсным выключателем на вводе часто встречается в малоэтажных постройках. Окончательное решение относительно того, какой вводной автомат поставить на дом 220 В, принимается только после предварительно проведенных расчетов по определению номинальной силы тока. Подключение двухполюсника выполняется как с заземлением, так и без него. В любом случае устройство способно полностью обесточить строение.

Схема подключения двухполюсного автоматического защитного выключателя с заземлением только до шиныИсточник uk-parkovaya.ru

Монтаж защитного выключателя в трехфазной сети тоже часто выполняется в частных домах. Ведь во многих постройках для приготовления блюд используют электрические плиты. Чаще монтируют трехполюсные устройства. Обычно в электролинию, где присутствует вводной автомат на 3 фазы, дополнительно устанавливают УЗО. Оно позволяет предотвратить поражение людей электротоком, если произойдет его утечка.

Четырехполюсный автомат на вводе трехфазной электрической линии устанавливают не так часто. Он обычно монтируется при прокладке проводов с четырьмя жилами. Одна из клемм четырехполюсника используется для подключения нейтрали. Намного чаще четырехполюсный выключатель применяется в четырехфазных электрических сетях. Ведь при возникновении нештатной ситуации на любой ветки устройство обесточит весь объект.

Важно! Когда рассчитывается и осуществляется выбор вводного автомата для трехфазной сети, нужно сложить нагрузки, которые приходятся на каждую ветку.

Об автоматах, отличающихся друг от друга количеством полюсов, и об их использовании рассказано в видеоролике:

Подбор по времятоковой характеристике

Более точно выбрать вводный автомат в частный дом можно, если учесть его времятоковую характеристику. При этом не нужно забывать про номинальный ток устройства. Способ подбора по времятоковой характеристике особенно актуален, если к электросети подключено оборудование, для работы которого требуются существенные пусковые токи.

Когда электроприборы в постройке создают стандартные нагрузки на электрическую сеть, часто можно встретить установленный автомат, у которого номинал составляет 16 А. При этом он относится к разновидности «C». Устройства с такой характеристикой очень часто используются в быту. Несмотря на это, существуют другие времятоковые характеристики – A, B, D и так далее.

Латинская буква находится на корпусе сразу после цифры силы тока конкретного автомата. Она обозначает тип кривой времятоковой характеристики. Самую высокую чувствительность имеет устройство типа A. У коммутационных аппаратов с другими буквами эта характеристика уменьшается.

Более подробно о номинале и времятоковой характеристике рассказано в видеоматериале:

Так, у устройства типа «B» электромагнитный расцепитель срабатывает, когда значение тока превышает допустимую величину в 3-4 раза. В коммутационном аппарате «C» электрическая цепь разрывается уже при 5-7 кратном увеличении значения. В автомате «D» – это происходит, когда фактическая сила тока превышает допустимую величину в 10 раз.

Значение времятоковой характеристики берут из документации на конкретный автоматический выключатель. Производители ее нередко размещают на своих официальных сайтах.

От вида нагрузки на электрическую сеть зависит, какой будет установлен автомат. Она обязательно учитывается, когда выбирается тип устройства. Точнее принимают во внимание способность нагрузки скачкообразно потреблять электроток.

Рекомендуется использовать выключатели типа «B», если в цепи отсутствуют существенные пусковые токи. В то же время лучше установить коммутационные аппараты «C» или «D», когда к линии подключен электродвигатель, для запуска которого требуется электроток, превышающий номинальное значение в несколько раз.

Пример графиков времятоковой характеристикиИсточник euro-avtomatika.ru
Какой кабель нужен для подключения дома к электросети на 15 кВт и как его подсоединять

Способ крепления

Сейчас все производители выпускают автоматические защитные выключатели для установки на DIN-рейку. Это удобный способ, так как не нужно автомат перед счетчиком прикручивать к стене или задней стенке электрощитка. Устройство крепится к рейке с помощью специальных DIN-фиксаторов.

Вводной коммутационный прибор устанавливается в отдельном корпусе или монтируется в общем электрощите, который крепят на столбе или даже стене дома. Исполнение защитного выключателя на входе электрической сети не имеет значения. Важно, чтобы был обеспечен свободный доступ к устройству как домовладельцу, так и инспектору Энергосбыта.

О том, как выполняется установка автоматов, рассказано в ролике:

Лучший способ покупки входного автомата

Чтобы не ошибиться и правильно решить, какой автомат поставить на ввод в доме с однофазной сетью или трехфазной проводкой, нужно обратиться в специализированную компанию. Квалифицированные сотрудники не только помогут подобрать коммутационный аппарат, но и выполнят его профессиональный монтаж.

Конечно, можно посетить ближайший магазин с электротехнической продукцией. Однако в этом случае неопытный человек может приобрести некачественный товар или устройство, неподходящее по силе тока. При этом специализированная компания предоставит гарантию на автомат и выполненные работы.

Согласование с энергосбытом

Нередко энергоснабжающая организация отказывает домовладельцу в получение определенной нагрузки по току. Хотя до этого человек выполнил в доме электрическую проводку по всем существующим правилам и даже рассчитал с погрешностью в 1 ампер каждого потребителя.

Иногда энергоснабжающая организация может отказать домовладельцу в получении рассчитанной нагрузки по токуИсточник td-komplekt.ru

Такая ситуация возникает из-за того, что энергоснабжающую организацию не интересует, какой автомат на ввод хочет поставить домовладелец. Она руководствуется лимитами на подводящую электролинию. Существующие нормативы нельзя превышать. При нарушении лимитов другие домовладельцы не смогут подключиться к трансформаторной подстанции. Превышение нормативов также приводит к постоянным перегрузкам подводящей электрической линии.

Совет! Всегда нужно сначала совершить визит в энергоснабжающую организацию и только потом выбирать и рассчитывать входной автомат до счетчика, сколько ампер он будет выдерживать, а также планировать всю схему электрического снабжения своего дома и других построек на частном участке.

Установка дублирующего автомата

Зоной ответственности аттестованных электриков является участок от входного автоматического выключателя до электросчетчика. Поэтому оба элемента подлежат обязательной опломбировки. Она выполняется, чтобы исключить незаконный отбор электрической энергии.

Пломба на вводном автомате и электросчетчикеИсточник specdispetcher.ru

Чтобы удобнее обслуживать и при необходимости выполнять ремонтные работы, в распределительном электрощите нередко домовладельцы решают установить дублирующий автоматический выключатель на вводе. Его монтаж выполняется после счетчика, но до групповых автоматов. Установка дублера осуществляется в электрощите, который находится в постройке.

Дублирующий выключатель должен быть рассчитан на меньшую силу тока, чем вводной коммутационный аппарат. Однако эта его характеристика обязана превышать аналогичный параметр групповых автоматов. Если такое правило невозможно выполнить, тогда устанавливают дублер, рассчитанный на такой же ток, как и устройство на входе. При таком варианте дублирующий элемент будет использоваться только в качестве размыкающего аппарата, когда понадобится провести ремонтные или другие работы.

Условная электрическая схема с вводным автоматом и его дублеромИсточник stroyka-electro.ru
Правильный расчёт номинала для автомата по мощности тока

Коротко о главном

Автоматический выключатель, который устанавливается на вводе электрической сети в постройку, способен полностью обесточить строение. Его монтаж всегда выполняется перед электросчетчиком, чтобы проводить обслуживание и ремонт узла учета или других элементов электроцепи.

Автомат на входе может иметь от 1 до 4 полюсов. Двух- и однополюсные устройства устанавливаются в однофазных сетях. Приборы с тремя и четырьмя полюсами монтируются при наличии 3-х фаз.

Подбирается коммутационный аппарат по максимальной силе тока с учетом нагрузки на сеть. При этом также рекомендуется учитывать времятоковую характеристику и обязательно принимать во внимание фазность электролинии. Для удобного выполнения работ можно установить дублер входного автомата, но уже после счетчика.

Учебное пособие по машинному обучению с примерами

Машинное обучение (МО) становится все более популярным благодаря растущему признанию того, что МО может играть ключевую роль в широком спектре критически важных приложений, таких как интеллектуальный анализ данных, обработка естественного языка, распознавание изображений и экспертные системы. Машинное обучение предоставляет потенциальные решения во всех этих и многих других областях и должно стать опорой нашей будущей цивилизации.

Предложение способных дизайнеров машинного обучения еще не удовлетворило этот спрос. Основная причина этого заключается в том, что ML просто сложна.В этом учебном пособии по машинному обучению представлены основы теории машинного обучения, изложены общие темы и концепции, что позволяет легко следовать логике и освоиться с основами машинного обучения.

Что такое машинное обучение?

Так что же такое «машинное обучение»? ML на самом деле состоит из лотов из вещей. Область довольно обширна и быстро расширяется, постоянно разделяясь и подразделяясь до тошноты на различные подспециальности и типы машинного обучения.

Однако есть некоторые основные общие черты, и всеобъемлющая тема лучше всего резюмируется этим часто цитируемым заявлением, сделанным Артуром Сэмюэлем еще в 1959 году: «[Машинное обучение — это] область исследования, которая дает компьютерам возможность учиться без явного программирования».

А совсем недавно, в 1997 году, Том Митчелл дал «правильное» определение, которое оказалось более полезным для инженеров: «Говорят, что компьютерная программа учится на опыте E в отношении некоторой задачи T и некоторого показателя производительности P. , если его производительность по T, измеряемая P, улучшается с увеличением опыта E.

«Говорят, что компьютерная программа учится на опыте E в отношении некоторой задачи T и некоторого показателя производительности P, если ее производительность на T, измеряемая P, улучшается с опытом E». — Том Митчелл, Университет Карнеги-Меллона

Итак, если вы хотите, чтобы ваша программа предсказывала, например, модели движения на оживленном перекрестке (задача T), вы можете запустить ее через алгоритм машинного обучения с данными о прошлых схемах движения (опыт E) и, если она успешно « изучен», тогда он будет лучше прогнозировать будущие модели трафика (показатель производительности P).

Однако очень сложная природа многих реальных проблем часто означает, что изобретение специализированных алгоритмов, которые каждый раз будут решать их идеально, нецелесообразно, если не невозможно. Примеры задач машинного обучения: «Это рак?», «Какова рыночная стоимость этого дома?», «Кто из этих людей дружит друг с другом?», «Взорвется ли этот ракетный двигатель при взлете? », «Понравится ли этому человеку этот фильм?», «Кто это?», «Что вы сказали?» и «Как вы управляете этой штукой?».Все эти проблемы — отличные цели для проекта машинного обучения, и на самом деле машинное обучение применялось к каждой из них с большим успехом.

ML решает проблемы, которые невозможно решить только численными средствами.

Среди различных типов задач машинного обучения проводится важное различие между контролируемым и неконтролируемым обучением:

  • Контролируемое машинное обучение: Программа «обучается» на предварительно определенном наборе «обучающих примеров», которые затем облегчают ее способность делать точные выводы при получении новых данных.
  • Неконтролируемое машинное обучение: Программа получает набор данных и должна найти в них закономерности и взаимосвязи.

Здесь мы в первую очередь сосредоточимся на обучении с учителем, но в конце статьи содержится краткое обсуждение обучения без учителя с некоторыми ссылками для тех, кто заинтересован в дальнейшем изучении темы.

Контролируемое машинное обучение

В большинстве приложений обучения с учителем конечной целью является разработка точно настроенной предиктивной функции h(x) (иногда называемой «гипотезой»).«Обучение» заключается в использовании сложных математических алгоритмов для оптимизации этой функции таким образом, чтобы при заданных входных данных x об определенной области (скажем, площади дома) она точно предсказывала некоторое интересное значение h(x) ( скажем, рыночная цена указанного дома).

На практике x почти всегда представляет несколько точек данных. Так, например, предиктор цены на жилье может принимать не только квадратные метры ( x1 ), но и количество спален ( x2 ), количество ванных комнат ( x3 ), количество этажей ( x4) , год постройки ( x5 ), почтовый индекс ( x6 ) и так далее.Определение того, какие входные данные использовать, является важной частью проектирования машинного обучения. Однако для пояснения проще всего предположить, что используется одно входное значение.

Допустим, наш простой предиктор имеет следующую форму:

где и — константы. Наша цель — найти идеальные значения и заставить наш предиктор работать как можно лучше.

Оптимизация предиктора h(x) выполняется с использованием обучающих примеров . Для каждого обучающего примера у нас есть входное значение x_train , для которого заранее известен соответствующий выход y .Для каждого примера мы находим разницу между известным правильным значением y и нашим предсказанным значением h(x_train) . С достаточным количеством обучающих примеров эти различия дают нам полезный способ измерить «неправильность» h(x) . Затем мы можем настроить h(x) , изменив значения и, чтобы сделать его «менее неправильным». Этот процесс повторяется снова и снова, пока система не сойдется к лучшим значениям для и . Таким образом, предсказатель обучается и готов делать реальные предсказания.

Примеры машинного обучения

В этом посте мы остановились на простых задачах ради иллюстрации, но ML существует потому, что в реальном мире проблемы намного сложнее. На этом плоском экране мы можем нарисовать не более чем трехмерный набор данных, но задачи машинного обучения обычно имеют дело с данными с миллионами измерений и очень сложными предикторными функциями. ML решает проблемы, которые невозможно решить только численными средствами.

Имея это в виду, давайте рассмотрим простой пример.Скажем, у нас есть следующие обучающие данные, в которых сотрудники компании оценили свою удовлетворенность по шкале от 1 до 100:

Во-первых, обратите внимание, что данные немного зашумлены. То есть, хотя мы видим, что в этом есть закономерность (т. е. удовлетворенность сотрудников имеет тенденцию расти по мере роста заработной платы), не все они четко укладываются в прямую линию. Это всегда будет иметь место с реальными данными (и мы абсолютно хотим обучить нашу машину, используя реальные данные!). Так как же мы можем научить машину точно предсказывать уровень удовлетворенности сотрудников? Ответ, конечно же, что мы не можем.Цель ML никогда не состоит в том, чтобы делать «идеальные» предположения, потому что ML имеет дело с областями, где таких вещей нет. Цель состоит в том, чтобы делать предположения, которые достаточно хороши, чтобы быть полезными.

Чем-то напоминает известное высказывание британского математика и профессора статистики Джорджа Э. П. Бокса о том, что «все модели ошибочны, но некоторые из них полезны».

Цель ML никогда не состоит в том, чтобы делать «идеальные» предположения, потому что ML имеет дело с областями, где таких вещей нет. Цель состоит в том, чтобы делать предположения, которые достаточно хороши, чтобы быть полезными.

Машинное обучение в значительной степени основано на статистике. Например, когда мы обучаем нашу машину обучению, мы должны предоставить ей статистически значимую случайную выборку в качестве обучающих данных. Если обучающий набор не является случайным, мы рискуем получить шаблоны машинного обучения, которых на самом деле нет. И если обучающая выборка слишком мала (см. закон больших чисел), мы не узнаем достаточно и даже можем прийти к неточным выводам. Например, попытка предсказать модели удовлетворенности в масштабах всей компании на основе данных только от высшего руководства, скорее всего, будет подвержена ошибкам.

С этим пониманием давайте дадим нашей машине данные, которые мы дали выше, и заставим ее изучить их. Сначала мы должны инициализировать наш предиктор h(x) с некоторыми разумными значениями и . Теперь наш предиктор выглядит так, если его поместить на наш тренировочный набор:

.

Если мы спросим этот предсказатель об удовлетворенности сотрудника, зарабатывающего 60 тысяч долларов, он предскажет рейтинг 27:

Очевидно, что это была ужасная догадка и что эта машина знает очень мало.

Итак, теперь давайте дадим этому предсказателю все зарплаты из нашего обучающего набора и возьмем разницу между полученными прогнозируемыми рейтингами удовлетворенности и фактическими рейтингами удовлетворенности соответствующих сотрудников. Если мы проделаем небольшое математическое волшебство (которое я вскоре опишу), мы сможем рассчитать с очень высокой степенью уверенности, что значения 13,12 для и 0,61 для дадут нам лучший предиктор.

И если мы повторим этот процесс, скажем, 1500 раз, наш предиктор в конечном итоге будет выглядеть так:

В этот момент, если мы повторим процесс, мы обнаружим это и больше не изменимся на какую-либо заметную величину, и, таким образом, мы увидим, что система сошлась.Если мы не допустили ошибок, значит, мы нашли оптимальный предиктор. Соответственно, если теперь мы снова запросим у машины оценку удовлетворенности сотрудника, который зарабатывает 60 000 долларов, она предскажет оценку примерно 60.

Теперь мы кое-что получили.

Регрессия машинного обучения: примечание о сложности

Приведенный выше пример технически представляет собой простую задачу одномерной линейной регрессии, которую в действительности можно решить, выведя простое нормальное уравнение и полностью пропустив этот процесс «настройки».Однако рассмотрим предиктор, который выглядит так:

.

Эта функция принимает входные данные в четырех измерениях и имеет различные полиномиальные члены. Вывод нормального уравнения для этой функции является серьезной проблемой. Многие современные задачи машинного обучения требуют тысяч или даже миллионов измерений данных для построения прогнозов с использованием сотен коэффициентов. Прогнозирование того, как будет выражен геном организма или каким будет климат через пятьдесят лет, — примеры таких сложных задач.

Многие современные задачи машинного обучения требуют тысяч или даже миллионов измерений данных для построения прогнозов с использованием сотен коэффициентов.

К счастью, итеративный подход, используемый системами машинного обучения, гораздо более устойчив к такой сложности. Вместо грубой силы система машинного обучения «нащупывает путь» к ответу. Для больших задач это работает намного лучше. Хотя это не означает, что машинное обучение может решить все сколь угодно сложные проблемы (на самом деле не может), оно делает его невероятно гибким и мощным инструментом.

Градиентный спуск — минимизация «неправильности»

Давайте подробнее рассмотрим, как работает этот итеративный процесс. Как в приведенном выше примере убедиться, что с каждым шагом мы становимся лучше, а не хуже? Ответ заключается в нашем «измерении неправильности», о котором упоминалось ранее, а также в небольшом расчете.

Мера неправильности известна как функция стоимости (также известная как функция потерь ), . Входные данные представляют все коэффициенты, которые мы используем в нашем предсказателе.Так что в нашем случае это действительно пара и . дает нам математическое измерение того, насколько неверен наш предиктор, когда он использует заданные значения и .

Выбор функции стоимости — еще одна важная часть программы ML. В разных контекстах быть «неправильным» может означать очень разные вещи. В нашем примере с удовлетворенностью сотрудников хорошо зарекомендовавшим себя стандартом является линейная функция наименьших квадратов:

.

В методе наименьших квадратов штраф за неверное предположение увеличивается квадратично с разницей между предположением и правильным ответом, поэтому он действует как очень «строгая» мера неправильности.Функция стоимости вычисляет средний штраф по всем обучающим примерам.

Итак, теперь мы видим, что наша цель состоит в том, чтобы найти и для нашего предиктора h(x) такие, чтобы наша функция стоимости была как можно меньше. Для этого мы призываем силу исчисления.

Рассмотрим следующий график функции стоимости для некоторой конкретной задачи машинного обучения:

Здесь мы можем видеть стоимость, связанную с различными значениями и . Мы видим, что форма графика имеет небольшую чашу.Дно чаши представляет собой наименьшую стоимость, которую наш предиктор может дать нам на основе данных обучения. Цель состоит в том, чтобы «скатиться с горки», и найти соответствующую этой точке точку.

Здесь в этом руководстве по машинному обучению появляется исчисление. Чтобы не усложнять объяснение, я не буду приводить здесь уравнения, но, по сути, мы берем градиент , который является парой производных от (одна над и одна над ). Градиент будет разным для каждого другого значения и и говорит нам, каков «наклон холма» и, в частности, «какой путь вниз» для этих конкретных s.Например, когда мы подставляем наши текущие значения в градиент, он может сказать нам, что добавление небольшого количества к и небольшое вычитание приведет нас к дну долины функции стоимости. Поэтому прибавляем немного к , а немного отнимаем от , и вуаля! Мы завершили один раунд нашего алгоритма обучения. Наш обновленный предиктор h(x) = + x будет возвращать лучшие прогнозы, чем раньше. Наша машина стала немного умнее.

Этот процесс чередования между вычислением текущего градиента и обновлением s по результатам известен как градиентный спуск.

Это охватывает базовую теорию, лежащую в основе большинства контролируемых систем машинного обучения. Но базовые концепции можно применять по-разному, в зависимости от решаемой проблемы.

Проблемы классификации в машинном обучении

Под контролируемым отмыванием денег есть две основные подкатегории:

  • Системы регрессионного машинного обучения: Системы, в которых прогнозируемое значение находится где-то в непрерывном спектре.Эти системы помогают нам с вопросами «Сколько?» или «Сколько?».
  • Классификационные системы машинного обучения: Системы, в которых мы ищем прогноз «да» или «нет», например «Является ли эта опухоль раковой?», «Соответствует ли это печенье нашим стандартам качества?» и так далее.

Как оказалось, основная теория машинного обучения более или менее одинакова. Основные отличия заключаются в конструкции предиктора h(x) и конструкции функции стоимости.

До сих пор наши примеры были сосредоточены на проблемах регрессии, поэтому давайте теперь также рассмотрим пример классификации.

Вот результаты исследования качества файлов cookie, где все обучающие примеры были помечены как «хорошие файлы cookie» ( y = 1 ) синим цветом или «плохие файлы cookie» ( y = 0 ) красным цветом.

В классификации предиктор регрессии не очень полезен. Обычно нам нужен предсказатель, который делает предположение где-то между 0 и 1. В классификаторе качества файлов cookie прогноз 1 будет представлять очень уверенное предположение о том, что печенье идеальное и очень аппетитное.Прогноз 0 означает высокую степень уверенности в том, что файл cookie является помехой для индустрии файлов cookie. Значения, попадающие в этот диапазон, представляют меньшую достоверность, поэтому мы можем спроектировать нашу систему таким образом, чтобы предсказание 0,6 означало: «Чувак, это трудный выбор, но я соглашусь с да, вы можете продать это печенье», в то время как значение точно в средний балл 0,5 может означать полную неопределенность. Это не всегда то, как доверие распределяется в классификаторе, но это очень распространенный дизайн, который подходит для целей нашей иллюстрации.

Оказывается, есть хорошая функция, которая хорошо фиксирует это поведение. Она называется сигмовидной функцией g(z) и выглядит примерно так:

z — это некоторое представление наших входных данных и коэффициентов, например:

, чтобы наш предиктор стал:

Обратите внимание, что сигмовидная функция преобразует наш вывод в диапазон от 0 до 1.

Логика построения функции затрат также различается по классификации.Мы снова спрашиваем: «Что значит, если догадка ошибочна?» и на этот раз очень хорошее эмпирическое правило заключается в том, что если правильное предположение было 0, а мы угадали 1, то мы были полностью и совершенно неправы, и наоборот. Поскольку вы не можете быть более неправы, чем абсолютно неправы, наказание в этом случае огромно. В качестве альтернативы, если правильное предположение было 0, а мы угадали 0, наша функция стоимости не должна добавлять никаких затрат каждый раз, когда это происходит. Если предположение было правильным, но мы не были полностью уверены (например, y = 1 , но h(x) = 0.8 ), это должно быть связано с небольшими затратами, и если наше предположение было неверным, но мы не были полностью уверены (например, y = 1 , но h(x) = 0,3 ), это должно сопровождаться значительными затратами. , но не настолько, как если бы мы были полностью неправы.

Это поведение фиксируется функцией журнала, так что:

Опять же, функция стоимости дает нам среднюю стоимость по всем нашим обучающим примерам.

Итак, здесь мы описали, как предиктор h(x) и функция стоимости различаются между регрессией и классификацией, но градиентный спуск по-прежнему работает нормально.

Предсказатель классификации можно визуализировать, нарисовав граничную линию; т. е. барьер, при котором прогноз изменяется с «да» (прогноз больше 0,5) на «нет» (прогноз меньше 0,5). При хорошо спроектированной системе наши данные cookie могут генерировать границу классификации, которая выглядит следующим образом:

.

Теперь эта машина кое-что знает о куках!

Введение в нейронные сети

Обсуждение машинного обучения было бы неполным без упоминания хотя бы нейронных сетей.Нейронные сети не только предлагают чрезвычайно мощный инструмент для решения очень сложных проблем, но также предлагают увлекательные подсказки о работе нашего собственного мозга и интригующие возможности для создания действительно интеллектуальных машин за один день.

Нейронные сети хорошо подходят для моделей машинного обучения, где количество входных данных огромно. Вычислительные затраты на решение такой задачи слишком велики для типов систем, которые мы обсуждали выше. Однако оказывается, что нейронные сети можно эффективно настраивать с помощью методов, которые в принципе поразительно похожи на градиентный спуск.

Подробное обсуждение нейронных сетей выходит за рамки этого руководства, но я рекомендую ознакомиться с нашим предыдущим постом на эту тему.

Неконтролируемое машинное обучение

Неконтролируемое машинное обучение обычно направлено на поиск взаимосвязей в данных. В этом процессе не используются обучающие примеры. Вместо этого системе дается набор данных и ставится задача найти в них закономерности и корреляции. Хороший пример — выявление сплоченных групп друзей в данных социальных сетей.

Алгоритмы машинного обучения, используемые для этого, сильно отличаются от тех, которые используются для обучения с учителем, и эта тема заслуживает отдельного сообщения. Однако, чтобы тем временем что-то пожевать, взгляните на алгоритмы кластеризации, такие как k-средние, а также изучите системы уменьшения размерности, такие как анализ основных компонентов. В нашей предыдущей публикации о больших данных также более подробно обсуждался ряд этих тем.

Заключение

Здесь мы рассмотрели большую часть базовой теории, лежащей в основе области машинного обучения, но, конечно, мы коснулись только самой поверхности.

Имейте в виду, что для реального применения теорий, содержащихся в этом введении, к реальным примерам машинного обучения необходимо гораздо более глубокое понимание обсуждаемых здесь тем. В машинном обучении есть много тонкостей и подводных камней, а также множество способов сбиться с пути того, что кажется идеально отлаженной мыслящей машиной. Почти с каждой частью базовой теории можно играть и изменять бесконечно, и результаты часто бывают ошеломляющими. Многие вырастают в совершенно новые области исследований, которые лучше подходят для решения конкретных проблем.

Понятно, что машинное обучение — невероятно мощный инструмент. В ближайшие годы он обещает помочь решить некоторые из наших самых насущных проблем, а также открыть совершенно новые возможности для фирм, занимающихся наукой о данных. Спрос на инженеров по машинному обучению будет только расти, предлагая невероятные шансы стать частью чего-то большого. Надеюсь, вы подумаете о том, чтобы принять участие в акции!


Подтверждение

Эта статья в значительной степени опирается на материал, который преподал профессор Стэнфордского университета доктор.Эндрю Нг в своем бесплатном и открытом курсе по машинному обучению. Курс подробно охватывает все, что обсуждается в этой статье, и дает массу практических советов практикующим специалистам по машинному обучению. Я не могу рекомендовать этот курс тем, кто заинтересован в дальнейшем изучении этой увлекательной области.

Введение в машинное обучение для начинающих | by Ayush Pant

В последние несколько лет машинное обучение стало модным словом, причиной этого может быть большой объем данных, производимых приложениями, увеличение вычислительной мощности за последние несколько лет и разработка лучших алгоритмов. .

Машинное обучение используется везде, от автоматизации рутинных задач до предоставления интеллектуальных идей, отрасли в каждом секторе пытаются извлечь из этого пользу. Возможно, вы уже используете устройство, которое его использует. Например, носимый фитнес-трекер, такой как Fitbit, или интеллектуальный домашний помощник, такой как Google Home. Но примеров использования машинного обучения гораздо больше.

  • Прогнозирование. Машинное обучение также можно использовать в системах прогнозирования. В примере с кредитом для вычисления вероятности неисправности системе потребуется классифицировать доступные данные по группам.
  • Распознавание изображений. Машинное обучение также можно использовать для распознавания лиц на изображении. Для каждого человека есть отдельная категория в базе данных из нескольких человек.
  • Распознавание речи — это перевод произносимых слов в текст. Он используется в голосовом поиске и многом другом. Голосовые пользовательские интерфейсы включают голосовой набор, маршрутизацию вызовов и управление устройством. Его также можно использовать для простого ввода данных и подготовки структурированных документов.
  • Медицинские диагнозы — ML обучен распознавать раковые ткани.
  • Финансовая отрасль и торговля — компании используют ОД в расследованиях мошенничества и проверке кредитоспособности.
Изображение: Связано | Машинное обучение против глубокого обучения

Это было в 1940-х годах, когда была изобретена первая компьютерная система с ручным управлением, ENIAC (электронный числовой интегратор и компьютер). В то время слово «компьютер» использовалось для обозначения человека с интенсивными вычислительными способностями, поэтому ENIAC называли числовой вычислительной машиной! Ну, вы можете сказать, что это не имеет никакого отношения к обучению?! НЕПРАВИЛЬНО, с самого начала идея заключалась в том, чтобы построить машину, способную подражать человеческому мышлению и обучению.

EIMC — электронный числовой интегратор и компьютер | Изображение: www.computerhistory.org

В 1950-х годах мы видим первую компьютерную игру, которая утверждает, что может победить чемпиона мира по шашкам. Эта программа очень помогла шашистам в улучшении своего мастерства! Примерно в то же время Фрэнк Розенблатт изобрел персептрон, который был очень-очень простым классификатором, но когда его объединяли в больших количествах в сеть, он становился могущественным монстром. Что ж, монстр соотносится со временем, а по тем временам это был настоящий прорыв.Затем мы видим несколько лет стагнации нейросетевого поля из-за его сложностей в решении тех или иных задач.

Благодаря статистике машинное обучение стало очень популярным в 1990-х годах. Пересечение информатики и статистики породило вероятностные подходы в ИИ. Это еще больше сместило поле в сторону подходов, основанных на данных. Имея доступ к крупномасштабным данным, ученые начали создавать интеллектуальные системы, способные анализировать и извлекать уроки из больших объемов данных.Примечательно, что система IBM Deep Blue обыграла чемпиона мира по шахматам, гроссмейстера Гарри Каспарова. Да, я знаю, что Каспаров обвинил IBM в жульничестве, но теперь это уже история, а Deep Blue мирно покоится в музее.

По словам Артура Сэмюэля, алгоритмы машинного обучения позволяют компьютерам учиться на данных и даже совершенствовать себя без явного программирования.

Машинное обучение (ML) — это категория алгоритма, который позволяет программным приложениям более точно прогнозировать результаты без явного программирования.Основная предпосылка машинного обучения заключается в создании алгоритмов, которые могут получать входные данные и использовать статистический анализ для прогнозирования выходных данных при обновлении выходных данных по мере появления новых данных.

Машинное обучение можно разделить на 3 типа алгоритмов.

  1. Обучение с учителем — [Ссылка скоро появится в будущем блоге]
  2. Обучение без учителя — [Ссылка скоро появится в будущем блоге]
  3. Обучение с подкреплением — [Ссылка скоро появится в будущем блоге]
3 типа обучения

В контролируемом обучении система ИИ представлена ​​данными, которые помечены, что означает, что все данные помечены правильной меткой.

Цель состоит в том, чтобы аппроксимировать функцию отображения так хорошо, чтобы при наличии новых входных данных (x) можно было предсказать выходные переменные (Y) для этих данных.

Пример контролируемого обучения

Как показано в приведенном выше примере, мы изначально взяли некоторые данные и пометили их как «Спам» или «Не спам». Эти помеченные данные используются моделью обучения под наблюдением, эти данные используются для обучения модели.

После того, как она будет обучена, мы можем протестировать нашу модель, протестировав ее с помощью нескольких тестовых новых писем, и проверка модели сможет предсказать правильный результат.

Типы контролируемого обучения

  • Классификация : Проблема классификации возникает, когда выходной переменной является категория, такая как «красный» или «синий» или «заболевание» и «отсутствие заболевания».
  • Регрессия : Проблема регрессии возникает, когда выходная переменная представляет собой реальное значение, например «доллары» или «вес».

При неконтролируемом обучении система ИИ представлена ​​неразмеченными, некатегоризированными данными, и алгоритмы системы действуют на данные без предварительного обучения.Результат зависит от закодированных алгоритмов. Подвергнуть систему неконтролируемому обучению — один из способов тестирования ИИ.

Пример обучения без учителя

В приведенном выше примере мы дали нашей модели несколько символов, которые являются «утками» и «не утками». В наших обучающих данных мы не даем никаких меток соответствующим данным. Неконтролируемая модель способна разделить как символы, просматривая тип данных, так и моделировать базовую структуру или распределение в данных, чтобы узнать о них больше.

Типы неконтролируемого обучения

  • Кластеризация : Задача кластеризации заключается в том, что вы хотите обнаружить присущие данные группировки, такие как группировка клиентов по покупательскому поведению.
  • Ассоциация : Проблема изучения правила ассоциации — это когда вы хотите обнаружить правила, которые описывают большие части ваших данных, например, люди, которые покупают X, также склонны покупать Y.

Алгоритм обучения с подкреплением, или агент, учится взаимодействуя с окружающей его средой.Агент получает вознаграждение за правильное выполнение и штрафы за неправильное выполнение. Агент обучается без вмешательства человека, максимизируя вознаграждение и минимизируя наказание. Это тип динамического программирования, который обучает алгоритмы, используя систему вознаграждения и наказания.

Пример обучения с подкреплением

В приведенном выше примере мы видим, что агенту предоставляется 2 варианта: путь с водой или путь с огнем. Алгоритм подкрепления работает на системе вознаграждения i.е. если агент использует путь огня, вознаграждение вычитается, и агент пытается узнать, что ему следует избегать пути огня. Если бы он выбрал водный путь или безопасный путь, то некоторые очки были бы добавлены к очкам вознаграждения, тогда агент попытался бы узнать, какой путь безопасен, а какой нет.

По сути, используя полученные вознаграждения, агент улучшает свои знания об окружающей среде, чтобы выбрать следующее действие.

В этом блоге я познакомил вас с основными понятиями машинного обучения, и я надеюсь, что этот блог был вам полезен и достаточно мотивировал вас, чтобы заинтересоваться этой темой.

Введение в машинное обучение

Введение

Машинное обучение — это подраздел искусственного интеллекта (ИИ). Целью машинного обучения обычно является понимание структуры данных и встраивание этих данных в модели, понятные и используемые людьми.

Хотя машинное обучение является областью информатики, оно отличается от традиционных вычислительных подходов. В традиционных вычислениях алгоритмы представляют собой наборы явно запрограммированных инструкций, используемых компьютерами для вычислений или решения задач.Вместо этого алгоритмы машинного обучения позволяют компьютерам обучаться на входных данных и использовать статистический анализ для вывода значений, попадающих в определенный диапазон. Из-за этого машинное обучение помогает компьютерам создавать модели из выборочных данных, чтобы автоматизировать процессы принятия решений на основе входных данных.

Сегодня любой пользователь технологий извлекает выгоду из машинного обучения. Технология распознавания лиц позволяет платформам социальных сетей помогать пользователям отмечать и делиться фотографиями друзей.Технология оптического распознавания символов (OCR) преобразует изображения текста в подвижный текст. Механизмы рекомендаций, основанные на машинном обучении, предлагают, какие фильмы или телепередачи посмотреть дальше, исходя из предпочтений пользователя. Самоуправляемые автомобили, которые полагаются на машинное обучение для навигации, вскоре могут быть доступны для потребителей.

Машинное обучение — это постоянно развивающаяся область. Поэтому при работе с методологиями машинного обучения или при анализе влияния процессов машинного обучения необходимо учитывать некоторые соображения.

В этом руководстве мы рассмотрим распространенные методы машинного обучения с учителем и без учителя, а также общие алгоритмические подходы к машинному обучению, включая алгоритм k-ближайшего соседа, обучение по дереву решений и глубокое обучение. Мы рассмотрим, какие языки программирования чаще всего используются в машинном обучении, предоставив вам некоторые положительные и отрицательные качества каждого из них. Кроме того, мы обсудим предубеждения, увековеченные алгоритмами машинного обучения, и рассмотрим, что следует учитывать, чтобы предотвратить эти предубеждения при построении алгоритмов.

Методы машинного обучения

В машинном обучении задачи обычно подразделяются на широкие категории. Эти категории основаны на том, как получено обучение или как обратная связь по обучению передается в разработанную систему.

Двумя наиболее широко распространенными методами машинного обучения являются контролируемое обучение , которое обучает алгоритмы на основе примеров входных и выходных данных, помеченных людьми, и неконтролируемое обучение , которое предоставляет алгоритму без помеченных данных, чтобы позволить ему найти структуру в своих входных данных.Рассмотрим эти методы более подробно.

Контролируемое обучение

При обучении с учителем компьютеру предоставляются примеры входных данных, которые помечены желаемыми выходными данными. Цель этого метода состоит в том, чтобы алгоритм мог «обучаться», сравнивая свои фактические выходные данные с «обученными» выходными данными, чтобы находить ошибки и соответствующим образом изменять модель. Таким образом, контролируемое обучение использует шаблоны для прогнозирования значений меток на дополнительных немаркированных данных.

Например, при обучении с учителем алгоритм может получать данные с изображениями акул, помеченными как рыбы , и изображениями океанов, помеченными как вода .Обучаясь на этих данных, алгоритм обучения с учителем должен впоследствии идентифицировать немаркированные изображения акул как рыб и немаркированные изображения океана как воды .

Обычный вариант обучения с учителем — использовать исторические данные для прогнозирования статистически вероятных будущих событий. Он может использовать историческую информацию о фондовом рынке, чтобы предвидеть предстоящие колебания, или использоваться для фильтрации спама. В обучении с учителем фотографии собак с тегами можно использовать в качестве входных данных для классификации фотографий собак без тегов.

Обучение без учителя

При обучении без учителя данные не маркируются, поэтому алгоритму обучения остается найти общие черты среди входных данных. Поскольку немаркированных данных больше, чем размеченных, методы машинного обучения, которые облегчают обучение без учителя, особенно ценны.

Цель неконтролируемого обучения может быть такой же простой, как обнаружение скрытых шаблонов в наборе данных, но также может иметь целью изучение признаков, что позволяет вычислительной машине автоматически обнаруживать представления, необходимые для классификации необработанных данных.

Неконтролируемое обучение обычно используется для транзакционных данных. У вас может быть большой набор данных о клиентах и ​​их покупках, но как человек вы, вероятно, не сможете понять, какие схожие атрибуты можно извлечь из профилей клиентов и их типов покупок. С помощью этих данных, введенных в алгоритм обучения без присмотра, можно определить, что женщины определенного возраста, покупающие мыло без запаха, скорее всего, беременны, и поэтому маркетинговая кампания, связанная с продуктами для беременных и детскими товарами, может быть нацелена на эту аудиторию, чтобы чтобы увеличить количество покупок.

Без «правильного» ответа неконтролируемые методы обучения могут рассматривать сложные данные, которые являются более обширными и, казалось бы, не связанными между собой, чтобы организовать их потенциально осмысленными способами. Неконтролируемое обучение часто используется для обнаружения аномалий, в том числе для мошеннических покупок по кредитным картам, и рекомендательных систем, которые рекомендуют, какие продукты покупать дальше. При неконтролируемом обучении фотографии собак без тегов могут использоваться в качестве входных данных для алгоритма, который находит сходство и классифицирует фотографии собак вместе.

Подходы

Как область машинное обучение тесно связано с вычислительной статистикой, поэтому наличие базовых знаний в области статистики полезно для понимания и использования алгоритмов машинного обучения.

Для тех, кто, возможно, не изучал статистику, может быть полезно сначала определить корреляцию и регрессию, поскольку они обычно используются для исследования взаимосвязи между количественными переменными. Корреляция — это мера связи между двумя переменными, которые не обозначены ни как зависимые, ни как независимые. Регрессия на базовом уровне используется для изучения связи между одной зависимой и одной независимой переменной. Поскольку статистику регрессии можно использовать для прогнозирования зависимой переменной, когда независимая переменная известна, регрессия обеспечивает возможности прогнозирования.

Подходы к машинному обучению постоянно развиваются. Для наших целей мы рассмотрим несколько популярных подходов, которые использовались в машинном обучении на момент написания.

k-ближайший сосед

Алгоритм k-ближайших соседей — это модель распознавания образов, которую можно использовать как для классификации, так и для регрессии. Часто сокращенно k-NN, k в k-ближайшем соседе представляет собой положительное целое число, которое обычно мало. Как в классификации, так и в регрессии входные данные будут состоять из k ближайших обучающих примеров в пространстве.

Мы сосредоточимся на классификации k-NN. В этом методе результатом является членство в классе.Это присвоит новый объект классу, наиболее распространенному среди k его ближайших соседей. В случае k = 1 объект относится к классу единственного ближайшего соседа.

Давайте рассмотрим пример k-ближайшего соседа. На приведенной ниже диаграмме есть объекты с голубым ромбом и объекты с оранжевой звездой. Они принадлежат к двум отдельным классам: алмазному классу и звездному классу.

Когда в пространство добавляется новый объект — в данном случае зеленое сердце — мы хотим, чтобы алгоритм машинного обучения отнес сердце к определенному классу.

Когда мы выбираем k = 3, алгоритм находит трех ближайших соседей зеленого сердца, чтобы отнести его либо к классу алмазов, либо к классу звезд.

На нашей диаграмме тремя ближайшими соседями зеленого сердца являются один ромб и две звезды. Следовательно, алгоритм будет классифицировать сердце по звездному классу.

Среди самых основных алгоритмов машинного обучения k-ближайший сосед считается типом «ленивого обучения», поскольку обобщение за пределы обучающих данных не происходит до тех пор, пока в систему не будет сделан запрос.

Обучение дереву решений

Для общего использования деревья решений используются для визуального представления решений и демонстрации или информирования о принятии решений. При работе с машинным обучением и интеллектуальным анализом данных в качестве прогностической модели используются деревья решений. Эти модели сопоставляют наблюдения о данных с выводами о целевом значении данных.

Целью обучения дерева решений является создание модели, которая будет предсказывать значение цели на основе входных переменных.

В прогностической модели атрибуты данных, которые определяются путем наблюдения, представлены ветвями, а выводы о целевом значении данных представлены листьями.

При «изучении» дерева исходные данные делятся на подмножества на основе проверки значения атрибута, которая рекурсивно повторяется для каждого из производных подмножеств. Как только подмножество в узле будет иметь значение, эквивалентное его целевому значению, процесс рекурсии будет завершен.

Давайте рассмотрим пример различных условий, которые могут определить, стоит ли кому-то идти на рыбалку. Это включает в себя погодные условия, а также условия барометрического давления.

В приведенном выше упрощенном дереве решений пример классифицируется путем его сортировки по дереву до соответствующего конечного узла.Затем он возвращает классификацию, связанную с конкретным листом, который в данном случае является либо Да , либо Нет . Дерево классифицирует условия дня в зависимости от того, подходит ли оно для рыбалки.

Настоящий набор данных дерева классификации будет иметь гораздо больше функций, чем указано выше, но отношения должны быть простыми для определения. При работе с обучением дерева решений необходимо сделать несколько определений, в том числе, какие функции выбрать, какие условия использовать для разделения и понять, когда дерево решений достигло четкого конца.

Глубокое обучение

Глубокое обучение пытается имитировать, как человеческий мозг может преобразовывать световые и звуковые стимулы в зрение и слух. Архитектура глубокого обучения основана на биологических нейронных сетях и состоит из нескольких слоев искусственной нейронной сети, состоящей из оборудования и графических процессоров.

Глубокое обучение использует каскад слоев нелинейной обработки для извлечения или преобразования признаков (или представлений) данных. Выход одного слоя служит входом последующего слоя.В глубоком обучении алгоритмы могут быть либо контролируемыми и служить для классификации данных, либо неконтролируемыми и выполнять анализ шаблонов.

Среди алгоритмов машинного обучения, которые в настоящее время используются и разрабатываются, глубокое обучение поглощает больше всего данных и смогло превзойти людей в некоторых когнитивных задачах. Благодаря этим атрибутам глубокое обучение стало подходом со значительным потенциалом в области искусственного интеллекта

.

Компьютерное зрение и распознавание речи добились значительных успехов по сравнению с подходами глубокого обучения.IBM Watson — хорошо известный пример системы, использующей глубокое обучение.

Языки программирования

При выборе языка для специализации машинного обучения вы можете рассмотреть навыки, перечисленные в текущих объявлениях о вакансиях, а также библиотеки, доступные на различных языках, которые можно использовать для процессов машинного обучения.

Из данных, взятых из объявлений о вакансиях на сайте Indeed.com в декабре 2016 года, можно сделать вывод, что Python является наиболее востребованным языком программирования в профессиональной сфере машинного обучения.За Python следует Java, затем R, затем C++.

Популярность Python может быть связана с активным развитием в последнее время сред глубокого обучения, доступных для этого языка, включая TensorFlow, PyTorch и Keras. Как язык с удобочитаемым синтаксисом и возможностью использования в качестве языка сценариев, Python оказывается мощным и простым как для предварительной обработки данных, так и для непосредственной работы с данными. Библиотека машинного обучения scikit-learn построена на основе нескольких существующих пакетов Python, с которыми разработчики Python, возможно, уже знакомы, а именно NumPy, SciPy и Matplotlib.

Чтобы начать работу с Python, вы можете прочитать нашу серию руководств «Как кодировать в Python 3» или прочитать, в частности, «Как создать классификатор машинного обучения в Python с помощью scikit-learn» или «Как выполнить передачу нейронного стиля». с Python 3 и PyTorch».

Java широко используется в корпоративном программировании и обычно используется разработчиками клиентских настольных приложений, которые также работают над машинным обучением на уровне предприятия. Обычно это не первый выбор для новичков в программировании, которые хотят узнать о машинном обучении, но его предпочитают те, у кого есть опыт разработки на Java, для применения в машинном обучении.Что касается приложений машинного обучения в промышленности, Java, как правило, используется для сетевой безопасности чаще, чем Python, в том числе в случаях использования в случаях кибератак и обнаружения мошенничества.

Среди библиотек машинного обучения для Java есть Deeplearning4j, распределенная библиотека глубокого обучения с открытым исходным кодом, написанная как для Java, так и для Scala; MALLET ( MA chine L заработок за L anguag E T oolkit) позволяет применять машинное обучение к тексту, включая обработку естественного языка, моделирование тем, классификацию документов и кластеризацию; и Weka, набор алгоритмов машинного обучения для использования в задачах интеллектуального анализа данных.

R — это язык программирования с открытым исходным кодом, используемый в основном для статистических вычислений. За последние годы он стал популярнее, и многие в академических кругах предпочитают его. R обычно не используется в промышленных производственных средах, но его популярность в промышленных приложениях возросла из-за возросшего интереса к науке о данных. Популярные пакеты для машинного обучения в R включают в себя Caret (сокращение от C lassification A nd RE gression T raining) для создания прогностических моделей, randomForest для классификации и регрессии и e1071, который включает функции для статистики и теории вероятностей. .

C++ — предпочтительный язык для машинного обучения и искусственного интеллекта в играх или приложениях для роботов (включая передвижение роботов). Разработчики встраиваемого вычислительного оборудования и инженеры-электронщики с большей вероятностью отдадут предпочтение C++ или C в приложениях машинного обучения из-за их владения языком и уровня контроля над ним. Некоторые библиотеки машинного обучения, которые вы можете использовать с C++, включают масштабируемый mlpack, Dlib, предлагающий широкий спектр алгоритмов машинного обучения, а также модульную Shark с открытым исходным кодом.

Человеческие предубеждения

Хотя данные и вычислительный анализ могут заставить нас думать, что мы получаем объективную информацию, это не так; то, что они основаны на данных, не означает, что результаты машинного обучения нейтральны. Человеческая предвзятость играет роль в том, как данные собираются, организуются и, в конечном счете, в алгоритмах, определяющих, как машинное обучение будет взаимодействовать с этими данными.

Если, например, люди предоставляют изображения для «рыб» в качестве данных для обучения алгоритма, и эти люди в подавляющем большинстве выбирают изображения золотых рыбок, компьютер может не классифицировать акулу как рыбу.Это создаст предубеждение против акул как рыб, и акулы не будут считаться рыбами.

При использовании исторических фотографий ученых в качестве обучающих данных компьютер может неправильно классифицировать ученых, которые также являются цветными людьми или женщинами. Фактически, недавнее рецензируемое исследование показало, что программы искусственного интеллекта и машинного обучения демонстрируют человеческие предубеждения, включая расовые и гендерные предрассудки. См., например, «Семантика, полученная автоматически из языковых корпусов, содержит предубеждения, подобные человеческим» и «Мужчины тоже любят делать покупки: снижение усиления гендерных предубеждений с помощью ограничений на уровне корпуса» [PDF].

Поскольку машинное обучение все больше используется в бизнесе, неуловимые предубеждения могут увековечить системные проблемы, которые могут помешать людям претендовать на кредиты, показывать рекламу высокооплачиваемых вакансий или получать варианты доставки в тот же день.

Поскольку человеческая предвзятость может негативно повлиять на других, чрезвычайно важно знать об этом, а также работать над ее устранением в максимально возможной степени. Один из способов добиться этого — обеспечить, чтобы над проектом работали разные люди, а также чтобы разные люди тестировали и проверяли его.Другие призвали регулирующие органы контролировать и проверять алгоритмы, создавать альтернативные системы, которые могут обнаруживать предубеждения, и проводить этические проверки в рамках планирования проекта по науке о данных. Повышение осведомленности о предубеждениях, памятование о наших собственных бессознательных предубеждениях и структурирование справедливости в наших проектах и ​​конвейерах машинного обучения могут помочь в борьбе с предубеждениями в этой области.

Заключение

В этом учебном пособии были рассмотрены некоторые варианты использования машинного обучения, распространенные методы и популярные подходы, используемые в этой области, подходящие языки программирования для машинного обучения, а также рассмотрены некоторые моменты, о которых следует помнить в отношении бессознательных предубеждений, воспроизводимых в алгоритмах.

Поскольку машинное обучение — это область, которая постоянно обновляется, важно помнить, что алгоритмы, методы и подходы будут продолжать меняться.

В дополнение к прочтению наших руководств «Как создать классификатор машинного обучения на Python с помощью scikit-learn» или «Как выполнить передачу нейронного стиля с помощью Python 3 и PyTorch», вы можете узнать больше о работе с данными в технологической отрасли. прочитав наши руководства по анализу данных.

P-значение в машинном обучении — GeeksforGeeks

P-значение помогает нам определить, насколько вероятно получение определенного результата, когда предполагается, что нулевая гипотеза верна.Это вероятность получить выборку, подобную нашей, или более экстремальную, чем наша, если нулевая гипотеза верна. Следовательно, если предполагается, что нулевая гипотеза верна, p-значение дает нам оценку того, насколько «странной» является наша выборка.

Если p-значение очень мало (обычно считается <0,05), то наша выборка является «странной», а это означает, что наше предположение о том, что нулевая гипотеза верна, скорее всего, будет ложным. Таким образом, мы отвергаем это. Давайте разберемся, что такое p-значение, на нескольких примерах:  

Примеры:  

1. Подбрасывание монеты  

Возможны два исхода: орел (H), решка (T). Пусть нулевая гипотеза будет H 0, , а альтернативная гипотеза будет H 1 . H 0 : Это честная монета ; H 1 Это предвзятая или нечестная монета . Предположим, что мы находимся во Вселенной, где нулевая гипотеза верна. Рассмотрим следующие события —

событие 9 P-значение 2

T

0.5

Т

0,25

Т

0,12

Т

0,06

Т

0,03

T

0,01

Значение p — это вероятность того, что событие произойдет, при условии, что H 0 истинно; то есть монета честная (если бы мы были во вселенной, где H 1 верно, то p-значение было бы равно 1 для всех событий).Выпадение решки один раз вполне регулярно, и для честной монеты вероятность появления События 1 равна 0,5. Однако каждый раз, когда мы подбрасываем монету, выпадает решка! Сомнительно, чтобы это произошло. Таким образом, p-значение уменьшается вниз по таблице. Вероятность того, что решка выпадет шесть раз подряд, равна 0,01, что довольно мало. Вероятность того, что событие произойдет во вселенной, где H 0 верно, составляет всего 1% (нам должно быть очень повезло, чтобы такое произошло).

Следовательно, мы отвергаем утверждение о том, что гипотеза верна, поскольку значение p становится ниже 0.05 (после 4-го события). 0,05 обычно считается статистической значимостью.

2. Печенье и орехи!!  

Мэри продает шоколадно-ореховое печенье. К сожалению, была жалоба на то, что в шоколадно-ореховом печенье было меньше арахиса, чем должно быть (в упаковке 200 г должно быть 70 г арахиса). Следовательно, она хотела проверить, обоснована ли жалоба. Для этого она берет 20 случайных образцов печенья из 400 штук, разворачивает их и плавит шоколад, чтобы взвесить орехи в каждой пачке.Если вес арахиса во всех 20 образцах намного превышал 70 г, а средний вес составлял около 95 г, жалоба определенно недействительна. Количество орехов на самом деле больше. Учтите, что вес арахиса во всех 20 образцах был намного меньше 70 г, а в среднем около 30 г. В этой ситуации возникает проблема с файлами cookie.

Здесь наша нулевая гипотеза (H 0 ) и альтернативная гипотеза (H 1 ) следующие: печенье).

  • H 1 – Средний вес арахиса в упаковке < 70 г.
  • Если вес арахиса во всех упаковках находится в диапазоне (65,75), что близко к 70 г, а среднее значение составляет около 68,5 г, трудно решить, верно ли наше утверждение о том, что H 0 верно. В таких случаях мы находим p-значение для этих данных по сравнению со средним значением 70 г. Предположим, что полученное значение p равно 0,18. Следовательно, существует 18%-ная вероятность получить такое низкое среднее значение (68,5 г), если с печеньем все в порядке (H 0 верно), то есть средний вес арахиса в печенье >= 70 г (Мэри полегчало!).

     Если бы полученное нами значение p было меньше уровня значимости 0,05, мы бы отклонили нулевую гипотезу.
      
     

    Демонстрация P-значения

    Таким образом, p-значение говорит нам, есть ли у нас доказательства из выборки о влиянии на популяцию. Если p-значение выше уровня значимости, у нас нет доказательства. По мере того, как p-значение становится ниже уровня значимости, наши доказательства становятся более убедительными, и, следовательно, мы можем отвергнуть утверждение о том, что нулевая гипотеза верна.

    Процедура, которую мы используем, чтобы определить, насколько сильным является доказательство, выглядит следующим образом:

    • Предположим, что H 0 верно.
    • Возьмите образец, получите статистику (среднее) и определите, насколько вероятно получение таких цифр, если H 0 верно. Параметр, который говорит нам о первом, — это p-значение.
    • Если p-значение довольно маленькое , H 0 , вероятно, неверно. Чем ниже p-значение, тем больше у нас доказательств того, что нулевая гипотеза ложна .
    • Если p-значение большое , наша первоначальная идея предположить, что H 0 верно, вероятно, верна. Следовательно, мы не отвергаем H 0 несущественный результат .
    • P-значение мало или велико по сравнению с уровнем значимости, который обычно равен 0,05. Он корректируется на основе эксперимента и того, как мы используем его результаты.

    Следовательно, p-значение равно , а не –  

    1. Вероятность того, что утверждение действительно.
    2. Вероятность того, что нулевая гипотеза верна.

    Это параметр, который помогает нам определить, насколько «странной» является выборка в предположении, что нулевая гипотеза верна. Таким образом, это помогает нам соответствующим образом изменить нулевую гипотезу.

    Введение в машинное обучение | Основы машинного обучения

    Введение в машинное обучение:

    Несомненно, машинное обучение является самой востребованной технологией на современном рынке.Его приложения варьируются от беспилотных автомобилей до прогнозирования смертельных заболеваний, таких как БАС. Высокий спрос на навыки машинного обучения является мотивацией этого блога. В этом блоге «Введение в машинное обучение» вы поймете все основные концепции машинного обучения и практическую реализацию машинного обучения с использованием языка R.

    В этом блоге «Введение в машинное обучение» рассматриваются следующие темы:

    1. Потребность в машинном обучении
    2. Что такое машинное обучение?
    3. Определения машинного обучения
    4. Процесс машинного обучения
    5. Типы машинного обучения
    6. Типы задач, решаемых с помощью машинного обучения
    7. Практическая реализация машинного обучения

    Потребность в машинном обучении генерируют неизмеримое количество данных.Согласно исследованиям, мы генерируем около 2,5 квинтиллионов байт данных каждый день! По оценкам, к 2020 году на каждого человека на Земле будет создаваться 1,7 МБ данных каждую секунду.

    При наличии такого большого количества данных наконец-то стало возможным создавать прогностические модели, которые могут изучать и анализировать сложные данные, чтобы находить полезную информацию и получать более точные результаты.

    Крупнейшие компании, такие как Netflix и Amazon, создают такие модели машинного обучения, используя огромное количество данных, чтобы выявить выгодные возможности и избежать нежелательных рисков.

    Вот список причин, по которым машинное обучение так важно:

    • Увеличение объемов генерации данных: Из-за чрезмерного производства данных нам нужен метод, который можно использовать для структурирования, анализа и извлечения полезной информации из данных. Здесь на помощь приходит машинное обучение. Оно использует данные для решения проблем и поиска решений самых сложных задач, стоящих перед организациями.
    • Улучшение принятия решений: Используя различные алгоритмы, машинное обучение можно использовать для принятия более эффективных бизнес-решений.Например, машинное обучение используется для прогнозирования продаж, прогнозирования падения цен на фондовом рынке, выявления рисков и аномалий и т. д.

    шаблоны и тенденции в данных : Поиск скрытых шаблонов и извлечение ключевой информации из данных — самая важная часть машинного обучения. Создавая прогностические модели и используя статистические методы, машинное обучение позволяет копать глубже и исследовать данные в мельчайших масштабах.Понимание данных и извлечение шаблонов вручную займет дни, тогда как алгоритмы машинного обучения могут выполнять такие вычисления менее чем за секунду.

  • Решение сложных задач: От обнаружения генов, связанных со смертельным заболеванием БАС, до создания беспилотных автомобилей, машинное обучение может использоваться для решения самых сложных задач.
  • Чтобы дать вам лучшее представление о том, насколько важно машинное обучение, давайте перечислим несколько приложений машинного обучения:

    • Система рекомендаций Netflix : Сердцем Netflix является ее печально известная система рекомендаций.Более 75% того, что вы смотрите, рекомендовано Netflix, и эти рекомендации сделаны с помощью машинного обучения.
    • Функция автоматической пометки Facebook: Логика, стоящая за системой проверки лиц Facebook DeepMind, основана на машинном обучении и нейронных сетях. DeepMind изучает черты лица на изображении, чтобы отметить ваших друзей и семью.
    • Alexa от Amazon: Печально известная Alexa, основанная на обработке естественного языка и машинном обучении, представляет собой виртуальный помощник продвинутого уровня, который делает больше, чем просто воспроизводит песни из вашего плейлиста.Он может заказать вам Uber, подключиться к другим устройствам IoT дома, отслеживать ваше здоровье и т. д.
    • Спам-фильтр Google: Gmail использует машинное обучение для фильтрации спам-сообщений. Он использует алгоритмы машинного обучения и обработку естественного языка для анализа электронных писем в режиме реального времени и классификации их как спам или не спам.

    Это было несколько примеров того, как машинное обучение внедряется в компаниях высшего уровня. Вот блог о 10 лучших приложениях машинного обучения, прочтите его, чтобы узнать больше.

    Теперь, когда вы знаете, почему машинное обучение так важно, давайте посмотрим, что же такое машинное обучение.

    Ознакомьтесь с курсами PG AI ML от E & ICT Academy NIT Warangal.

    Введение в машинное обучение

    Термин «машинное обучение» был впервые введен Артуром Сэмюэлем в 1959 году. Оглядываясь назад, можно сказать, что этот год был, вероятно, самым значительным с точки зрения технологических достижений.

    Если вы просмотрите в сети информацию о том, что такое машинное обучение, вы найдете не менее 100 различных определений.Однако самое первое формальное определение было дано Томом М. Митчеллом:

    «Говорят, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и меры производительности P, если ее производительность при выполнении задач в T, как измеряется P, улучшается с опытом E».

    Проще говоря, Машинное обучение — это разновидность искусственного интеллекта (ИИ), который дает машинам возможность учиться автоматически и совершенствоваться на основе полученного опыта без явного программирования для этого. В том смысле, что это практика заставить Машины решать проблемы, приобретая способность мыслить.

    Но подождите, может ли машина думать или принимать решения? Что ж, если вы снабдите машину большим объемом данных, она научится интерпретировать, обрабатывать и анализировать эти данные с помощью алгоритмов машинного обучения, чтобы решать реальные проблемы.

    Прежде чем двигаться дальше, давайте обсудим некоторые из наиболее часто используемых терминов в машинном обучении.

    Определения машинного обучения

    Алгоритм: Алгоритм машинного обучения — это набор правил и статистических методов, используемых для изучения закономерностей на основе данных и извлечения из них важной информации.Это логика модели машинного обучения. Примером алгоритма машинного обучения является алгоритм линейной регрессии.

    Модель: Модель является основным компонентом машинного обучения. Модель обучается с помощью алгоритма машинного обучения. Алгоритм отображает все решения, которые модель должна принять на основе заданных входных данных, чтобы получить правильный результат.

    Predictor Variable: Это характеристика данных, которые можно использовать для прогнозирования выходных данных.

    Переменная ответа: Это характеристика или выходная переменная, которую необходимо предсказать с помощью переменных-предикторов.

    Данные обучения: Модель машинного обучения строится с использованием данных обучения. Данные обучения помогают модели определить ключевые тенденции и закономерности, необходимые для прогнозирования результатов.

    Данные тестирования: После обучения модели ее необходимо протестировать, чтобы оценить, насколько точно она может предсказать результат. Это делается набором тестовых данных.

    Что такое машинное обучение? — Введение в машинное обучение — Edureka

    Подводя итог, взгляните на рисунок выше. Процесс машинного обучения начинается с подачи на машину большого количества данных. Используя эти данные, машина обучается обнаруживать скрытые идеи и тенденции. Эти идеи затем используются для построения модели машинного обучения с использованием алгоритма для решения проблемы.

    Следующая тема в этом блоге «Введение в машинное обучение» — процесс машинного обучения.

    Процесс машинного обучения

    Процесс машинного обучения включает создание прогнозной модели, которую можно использовать для поиска решения для постановки задачи. Чтобы понять процесс машинного обучения, давайте предположим, что вам поставили задачу, которую необходимо решить с помощью машинного обучения.

    Процесс машинного обучения. Введение в машинное обучение.

    В процессе машинного обучения выполняются следующие шаги:

    Шаг 1: Определите цель постановки задачи

    На этом этапе мы должны понять, что именно нужно предсказать. В нашем случае цель состоит в том, чтобы предсказать возможность дождя, изучая погодные условия. На этом этапе также важно делать мысленные заметки о том, какие данные можно использовать для решения этой проблемы или о типе подхода, которому вы должны следовать, чтобы найти решение.

    Шаг 2: Сбор данных

    На этом этапе вы должны задать такие вопросы, как

    • Какие данные необходимы для решения этой проблемы?
    • Доступны ли данные?
    • Как я могу получить данные?

    Когда вы знаете, какие типы данных требуются, вы должны понять, как вы можете получить эти данные. Сбор данных может производиться вручную или с помощью веб-скрапинга. Однако, если вы новичок и просто хотите изучить машинное обучение, вам не нужно беспокоиться о получении данных.В Интернете есть тысячи ресурсов данных, вы можете просто загрузить набор данных и приступить к работе.

    Возвращаясь к рассматриваемой проблеме, данные, необходимые для прогнозирования погоды, включают в себя такие показатели, как уровень влажности, температура, давление, местность, живете ли вы в горной станции и т. д. Такие данные необходимо собирать и хранить для анализа .

    Шаг 3 : Подготовка данных

    Собранные вами данные почти никогда не бывают в правильном формате. Вы столкнетесь с множеством несоответствий в наборе данных, таких как отсутствующие значения, избыточные переменные, повторяющиеся значения и т. д.Устранение таких несоответствий очень важно, поскольку они могут привести к ошибочным вычислениям и прогнозам. Поэтому на этом этапе вы сканируете набор данных на наличие несоответствий и сразу же исправляете их.

    Этап 4: Исследовательский анализ данных

    Наденьте детективные очки, потому что на этом этапе нужно глубоко погрузиться в данные и найти все тайны, скрытые в данных. EDA или исследовательский анализ данных — это этап мозгового штурма машинного обучения. Исследование данных включает в себя понимание закономерностей и тенденций в данных.На этом этапе извлекаются все полезные идеи и понимаются корреляции между переменными.

    Например, в случае прогнозирования дождя мы знаем, что существует большая вероятность дождя, если температура упала ниже нуля. Такие корреляции должны быть поняты и нанесены на карту на данном этапе.

    Шаг 5: Построение модели машинного обучения

    Все идеи и шаблоны, полученные в ходе исследования данных, используются для построения модели машинного обучения.Этот этап всегда начинается с разделения набора данных на две части: данные обучения и данные тестирования. Данные обучения будут использоваться для построения и анализа модели. Логика модели основана на реализуемом алгоритме машинного обучения.

    В случае прогнозирования осадков, поскольку вывод будет иметь форму «Истина» (если завтра будет дождь) или «Ложь» (завтра дождя не будет), мы можем использовать алгоритм классификации, такой как логистическая регрессия.

    Выбор правильного алгоритма зависит от типа задачи, которую вы пытаетесь решить, набора данных и уровня сложности задачи.В следующих разделах мы обсудим различные типы проблем, которые можно решить с помощью машинного обучения.

    Шаг 6: Оценка и оптимизация модели

    После построения модели с использованием набора данных для обучения настало время протестировать модель. Набор тестовых данных используется для проверки эффективности модели и того, насколько точно она может предсказать результат. После расчета точности на этом этапе могут быть реализованы любые дальнейшие улучшения в модели.Для повышения производительности модели можно использовать такие методы, как настройка параметров и перекрестная проверка.

    Шаг 7: Прогнозы

    После оценки и улучшения модели ее наконец используют для прогнозирования. Конечный результат может быть категориальной переменной (например, True или False) или непрерывным количеством (например, прогнозируемой стоимостью запаса).

    В нашем случае для прогнозирования дождя выходными данными будет категориальная переменная.

    Таков был весь процесс машинного обучения.Теперь пришло время узнать о различных способах обучения машин.

    Типы машинного обучения

    Машина может научиться решать задачу, следуя любому из следующих трех подходов. Вот способы обучения машины:

    1. Обучение с учителем
    2. Обучение без учителя
    3. Обучение с подкреплением

    Обучение с учителем

    Обучение с учителем хорошо маркируется.

    Чтобы понять контролируемое обучение, рассмотрим аналогию. В детстве мы все нуждались в руководстве для решения математических задач. Наши преподаватели помогли нам понять, что такое сложение и как оно делается. Точно так же вы можете думать об обучении с учителем как о типе машинного обучения, в котором используется руководство. Размеченный набор данных — это учитель, который научит вас понимать закономерности в данных. Помеченный набор данных — это не что иное, как набор обучающих данных.

    Обучение с учителем — Введение в машинное обучение — Edureka

    Рассмотрим рисунок выше.Здесь мы передаем машине изображения Тома и Джерри, и цель состоит в том, чтобы машина идентифицировала и классифицировала изображения на две группы (изображения Тома и изображения Джерри). Набор обучающих данных, который передается модели, помечен, например, мы говорим машине: «Вот как выглядит Том, а это Джерри». Поступая таким образом, вы обучаете машину, используя помеченные данные. В контролируемом обучении есть четко определенный этап обучения, выполняемый с помощью помеченных данных.

    Обучение без учителя

    Обучение без учителя предполагает обучение с использованием неразмеченных данных и позволяет модели действовать на основе этой информации без руководства.

    Думайте об обучении без присмотра как о умном ребенке, который учится без какого-либо руководства. В этом типе машинного обучения модель не получает размеченных данных, так как модель не имеет ни малейшего представления о том, что «это изображение — Том, а это — Джерри», она самостоятельно определяет закономерности и различия между Томом и Джерри. принимая тонны данных.

    Неконтролируемое обучение — Введение в машинное обучение — Edureka

    Например, он идентифицирует характерные черты Тома, такие как заостренные уши, больший размер и т. д., чтобы понять, что это изображение относится к типу 1.Точно так же он находит такие признаки у Джерри и знает, что это изображение относится к типу 2. Поэтому он классифицирует изображения по двум разным классам, не зная, кто такой Том или Джерри.

    Обучение с подкреплением

    Обучение с подкреплением — это часть машинного обучения, когда агент помещается в среду и учится вести себя в этой среде, выполняя определенные действия и наблюдая за вознаграждением, которое он получает от этих действий.


    Этот тип машинного обучения сравнительно отличается.Представьте, что вас высадили на изолированном острове! Что бы ты сделал?

    Паника? Да, конечно, поначалу мы все хотели. Но со временем вы научитесь жить на острове. Вы будете исследовать окружающую среду, понимать климатические условия, тип пищи, которая там растет, опасности острова и т. д. Именно так работает обучение с подкреплением, в нем участвует агент (вы, застрявший на острове), которого помещают в неизвестной среде (на острове), где он должен учиться, наблюдая и выполняя действия, которые приводят к вознаграждению.

    Обучение с подкреплением в основном используется в продвинутых областях машинного обучения, таких как самоуправляемые автомобили, AplhaGo и т. д.

    Чтобы лучше понять разницу между обучением с учителем, без учителя и обучением с подкреплением, вы можете просмотреть это короткое видео.

    Контролируемое, неконтролируемое и обучение с подкреплением | Сертификационный тренинг по науке о данных | Edureka

    В этом видео о контролируемом, неконтролируемом и обучении с подкреплением мы обсудим типы машинного обучения и будем различать их на основе нескольких ключевых параметров.

     

    Итак, подытожим типы машинного обучения. Теперь давайте посмотрим на типы проблем, которые решаются с помощью машинного обучения.

    Типы задач в машинном обучении

    Типы задач, решаемых с помощью машинного обучения. Введение в машинное обучение. Обучение:

    1. Регрессия: В задачах этого типа выход представляет собой непрерывную величину.Так, например, если вы хотите предсказать скорость автомобиля с учетом расстояния, это проблема регрессии. Проблемы регрессии можно решить с помощью алгоритмов контролируемого обучения, таких как линейная регрессия.
    2. Классификация: В этом типе выход представляет собой категориальное значение. Классификация электронных писем на два класса: спам и не спам — это проблема классификации, которую можно решить с помощью алгоритмов классификации контролируемого обучения, таких как машины опорных векторов, наивный байесовский метод, логистическая регрессия, K ближайший сосед и т. д.
    3. Кластеризация: Этот тип проблемы включает в себя распределение входных данных по двум или более кластерам на основе схожести признаков. Например, кластеризация зрителей в похожие группы на основе их интересов, возраста, географии и т. д. может быть выполнена с помощью алгоритмов обучения без учителя, таких как кластеризация K-средних.

    Вот таблица, в которой резюмируется разница между регрессией, классификацией и кластеризацией.

    Регрессия, классификация и кластеризация. Введение в машинное обучение. Кластеризация) это:

    1. Постановка задачи 1: Изучите набор банковских кредитных данных и примите решение об одобрении кредита заявителя на основе его социально-экономического профиля.
    2. Постановка задачи 2: Изучить набор данных о продажах домов и построить модель машинного обучения, которая прогнозирует индекс цен на жилье.
    3. Постановка задачи 3: Группировать набор фильмов как хорошие или средние на основе их охвата в социальных сетях.

    Не забудьте оставить свой ответ в разделе комментариев.

    Теперь, когда у вас есть хорошее представление о том, что такое машинное обучение и какие процессы в нем задействованы, давайте запустим демонстрацию, которая поможет вам понять, как на самом деле работает машинное обучение.

    Машинное обучение в R

    Небольшая оговорка: я буду использовать язык R, чтобы показать, как работает машинное обучение. R — это язык статистического программирования, который в основном используется для науки о данных и машинного обучения. Чтобы узнать больше о R, вы можете просмотреть следующие блоги:

    1. R Tutorial — Руководство для начинающих по изучению программирования на R
    2. R Programming — Руководство для начинающих по языку программирования R
    3. 50 лучших вопросов для интервью R, которые вы должны подготовить в 2019 году
    4. Подробное руководство по R для науки о данных

    Теперь приступим.

    Постановка задачи: Изучить набор данных прогноза погоды в Сиэтле и построить модель машинного обучения, которая может прогнозировать вероятность дождя.

    Набор данных Описание: Набор данных был собран путем исследования и наблюдения за погодными условиями в международном аэропорту Сиэтл-Такома. Набор данных содержит следующие переменные:

    • DATE = дата наблюдения
    • PRCP = количество осадков, в дюймах
    • TMAX = максимальная температура за этот день, в градусах Фаренгейта
    • TMIN = минимальная температура за этот день, в градусах Фаренгейта градусов по Фаренгейту
    • ДОЖДЬ = ИСТИНА, если в этот день наблюдался дождь, ЛОЖЬ, если его не было

    В данном случае целью или переменной отклика является «ДОЖДЬ».Если вы заметили, эта переменная является категориальной по своей природе, то есть ее значение имеет две категории: True или False. Следовательно, это проблема классификации, и мы будем использовать алгоритм классификации, называемый логистической регрессией.

    Несмотря на то, что название предполагает, что это алгоритм «регрессии», на самом деле это не так. Он принадлежит к семейству GLM (обобщенная линейная модель) и, следовательно, называется логистической регрессией.

    Следуйте этому, Всестороннее руководство по логистической регрессии В блоге R, чтобы узнать больше о логистической регрессии.

    Логика: Чтобы построить модель логистической регрессии, чтобы предсказать, будет ли дождь в определенный день, исходя из погодных условий.

    Теперь, когда вы знаете цель этой демонстрации, давайте заставим наши мозги работать и начнем программировать.

    Шаг 1. Установите и загрузите библиотеки

    R предоставляет тысячи пакетов для запуска алгоритмов машинного обучения и математических моделей. Итак, первый шаг — установить и загрузить все соответствующие библиотеки.

    #Загрузить необходимые библиотеки
    библиотека (tidyverse)
    библиотека (загрузочная)
    install.packages('прогноз')
    библиотека (прогноз)
    библиотека (серия)
    install.packages('каре')
    библиотека (каре)
    install.packages('ROCR')
    библиотека (РОЦР)
    
     

    Каждая из этих библиотек служит определенной цели. Подробнее о библиотеках можно прочитать в официальной документации R.

    Шаг 2: Импорт набора данных

    К счастью для меня, я нашел набор данных в Интернете, поэтому мне не нужно собирать его вручную.В приведенном ниже фрагменте кода я загрузил набор данных в переменную с именем «data.df» с помощью функции «read.csv()», предоставленной R. Эта функция предназначена для загрузки файла версии с разделителями-запятыми (CSV). .

    #Импорт набора данных
    data.df <- read.csv("/Users/Zulaikha_Geer/Desktop/Data/seattleWeather_1948-2017.csv", header = TRUE)
    
     

    Шаг 3: Изучение набора данных

    Давайте посмотрим на пару наблюдений в наборе данных. Для этого мы можем использовать функцию head(), предоставленную R.Это перечислит первые 6 наблюдений в наборе данных.

    > голова(данные.df)
    ДАТА     PRCP   ТМАКС   ТМИН  ДОЖДЬ
    1 1948-01-01    0,47       51      42    ПРАВДА
    2 1948-01-02   0,59      45      36    ПРАВДА
    3 1948-01-03   0.42      45      35    ПРАВДА
    4 1948-01-04   0,31      45      34     ИСТИНА
    5 1948-01-05   0,17      45      32     ИСТИНА
    6 1948-01-06   0,44     48      39     ИСТИНА
    
     

    Теперь давайте посмотрим на структуру набора данных с помощью функции str().

    #Изучаем структуру набора данных
    > ул(данные.df)
    'data.frame': 25551 обс. из 5 переменных:
    $ ДАТА: Фактор с 25551 уровнями "1948-01-01", "1948-01-02",..: 1 2 3 4 5 6 7 8 9 10 ...
    $ PRCP: число 0,47 0,59 0,42 0,31 0,17 0,44 0,41 0,04 0,12 0,74 ...
    $ TMAX: целое 51 45 45 45 45 48 50 48 50 43 ...
    $ TMIN: целое 42 36 35 34 32 39 40 35 31 34 ...
    $ ДОЖДЬ: logi ИСТИНА ИСТИНА ИСТИНА ИСТИНА ИСТИНА ИСТИНА ИСТИНА...
    
     

    В приведенном выше коде видно, что тип данных для переменных «ДАТА» и «ДОЖДЬ» имеет неправильный формат.Переменная «ДАТА» должна иметь тип «Дата», а переменная «ДОЖДЬ» должна быть фактором.

    Шаг 4. Очистка данных

    Приведенный ниже фрагмент кода при форматировании переменных «ДАТА» и «ДОЖДЬ»:

    # Форматирование переменных «дата» и «дождь»
    data.df$DATE <- as.Date(data.df$DATE)
    data.df$RAIN <- as.factor(data.df$RAIN)
    
     

    Как я уже упоминал ранее, важно проверить наличие любых отсутствующих или неактивных значений в наборе данных, приведенный ниже фрагмент кода проверяет значения NA в каждой переменной:

    #Проверка значений NA в переменной 'DATE'
    > который (т.нет(данные.df$DATE))
    целое (0)
    
    #Проверка значений NA в переменной 'TMAX'
    > который(is.na(data.df$TMAX))
    целое (0)
    
    #Проверка значений NA в переменной 'TMIN'
    > который(is.na(data.df$TMIN))
    целое (0)
    
    #Проверка значений NA в переменной 'PRCP'
    > который(является.na(data.df$PRCP))
    [1] 18416 18417 21068
    
    #Проверка значений NA в переменной 'rain'
    > который(является.na(data.df$RAIN))
    [1] 18416 18417 21068
    
     

    Если вы заметили приведенный выше фрагмент кода, вы можете видеть, что переменные TMAX, TMIN и DATE не имеют значений NA, тогда как переменная «PRCP» и «RAIN» имеет 3 пропущенных значения, эти значения необходимо удалить.

    # Удалить строки с отсутствующим значением RAIN
    > data.df <- data.df[-c(18416, 18417, 21068),]
    
     

    Значения успешно удалены!

    Шаг 5. Объединение данных

    Объединение данных — это еще один причудливый термин для разделения набора данных на обучающий и тестовый наборы. Набор данных для обучения должен быть больше, поскольку для обучения модели и помощи в изучении тенденций требуется гораздо больше данных. Приведенный ниже фрагмент кода разбивает набор данных на наборы для обучения и тестирования в соотношении 7:3.Это означает, что 70% данных используются для обучения, а 30% — для тестирования.

    #Сращивание данных
    # Разбиение данных: создайте набор данных для обучения и тестирования (0,7: 0,3)
    индекс <- createDataPartition (data.df $ RAIN, p = 0,7, список = FALSE)
    # Обучающий набор
    train.df <- data.df[index,]
    # Тестирование набора данных
    test.df <- data.df[-index,]
    
     

    Вы можете просмотреть сводку набора данных тестирования и обучения, используя функцию summary() в R:

    > резюме (поезд.дф)
    
    > резюме (test.df)
    
     

    Этап 6: Исследование данных

    Этот этап включает обнаружение закономерностей в данных и выявление корреляций между переменными-предикторами и переменной-откликом. В приведенном ниже фрагменте кода я использовал функцию cor.test(), предоставленную R.

    Этот тест корреляции показывает значимость переменных-предикторов при построении модели. Кроме того, функция cor.test() требует, чтобы у вас были переменные числового типа, поэтому в приведенном ниже коде я отформатировал переменную «Дождь» как числовую.

    #Установка переменной дождя как числовой для вычисления корреляции
    train.df$RAIN <- as.numeric(train.df$RAIN) #Корреляция между переменной «Дождь» и «TMAX» > cor.test(train.df$TMAX, train.df$RAIN)
    
    Корреляция продукта и момента Пирсона
    
    данные: train.df$TMAX и train.df$RAIN
    t = -55,492, df = 17882, p-значение < 2,2e-16 Альтернативная гипотеза: истинная корреляция не равна 0 95-процентный доверительный интервал: -0,3957173 -0,3707104 выборочные оценки: cor -0,3832841 > # Корреляция между переменной «Дождь» и «ТМИН»
    кор.тест (train.df$TMIN, train.df$RAIN)
    
    Корреляция продукта и момента Пирсона
    
    данные: train.df$TMIN и train.df$RAIN
    t = -18,163, df = 17882, p-значение <2,2e-16
    альтернативная гипотеза: истинная корреляция не равна 0
    95-процентный доверительный интервал:
    -0,1489493 -0,1201678
    примерные оценки:
    кор
    -0,1345869
    
     

    Приведенные выше выходные данные показывают, что и TMIN, и TMAX являются значимыми переменными-предикторами. Обратите внимание на p-значение для обеих переменных. Значение p или значение вероятности является наиболее важным параметром для понимания значимости модели.

    Если p-значение переменной меньше 0,05, это считается важной характеристикой для прогнозирования результата. В нашем случае p-значение для каждой из этих переменных намного ниже 0,05, что хорошо.

    Прежде чем двигаться дальше, давайте преобразуем переменную RAIN обратно в тип factor:

    #Установка переменной дождя в качестве фактора для построения модели
    train.df$RAIN <- as.factor(train.df$RAIN)
    
     

    Шаг 7. Построение модели машинного обучения

    После понимания взаимосвязей пришло время построить модель.Мы будем использовать алгоритм логистической регрессии для построения модели. R предоставляет функцию под названием glm(), которая содержит алгоритм логистической регрессии. Синтаксис функции glm():

    glm(формула, данные, семейство)

    В приведенном выше синтаксисе:

    • Формула: Формула представляет отношение между зависимой и независимой переменными.
    • Данные: набор данных, к которому применяется формула.
    • Семейство: В этом поле указывается тип регрессионной модели.В нашем случае это модель бинарной логистической регрессии.
    > #Построение модели логической регрессии
    > # glm логистическая регрессия
    > модель <- glm (ДОЖДЬ ~ TMAX + TMIN, данные = train.df, семейство = биномиальное) > сводка (модель)
    
    Вызов:
    glm (формула = ДОЖДЬ ~ TMAX + TMIN, семейство = биномиальное, данные = train.df)
    
    Остатки отклонений:
    Мин. 1 кв. Медиана 3 кв. Макс.
    -2,4700 -0,8119 -0,2557 0,8490 3,2691
    
    Коэффициенты:
    Оценка стд. Значение ошибки z Pr(>|z|)
    (Перехват) 2,808373 0,098668 28,46 <2e-16 ***
    ТМАКС -0.250859 0,004121 -60,87 <2е-16***
    ТМИН 0,259747 0,005036 51,57 <2e-16 ***
    ---
    Сигн. коды: 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ 0,1 ‘ & Rsquo; 1
    
    (Параметр дисперсии для биномиального семейства принят равным 1)
    
    Нулевое отклонение: 24406 на 17883 степеней свободы
    Остаточное отклонение: 17905 на 17881 степень свободы
    АИК: 17911
    
    Количество итераций оценки Фишера: 5
    
     

    Мы успешно построили модель с использованием переменных «TMAX» и «TMIN», поскольку они имеют сильную корреляцию с целевой переменной («Дождь»).

    Шаг 8. Оценка модели

    На этом этапе мы проверим эффективность модели машинного обучения, используя набор тестовых данных.

    #Оценка модели
    #Сохранение прогнозируемых значений
    > предсказанные_значения <- предсказать (модель, test.df, тип = "ответ") > голова (прогнозированные_значения)
    2 4 5 8 9 18
    0,7048729 0,5868884 0,4580049 0,4646309 0,1567753 0,8585068
    
    #Создание таблицы, содержащей фактические значения «ДОЖДЬ» в наборе тестовых данных
    > таблица (тест.df$RAIN)
    
    ЛОЖЬ ПРАВДА
    4394     3270
    > nrows_prediction<-nrow(test.df) #Создание фрейма данных, содержащего прогнозируемые значения «дождя» > Prediction <- data.frame(c(1:nrows_prediction)) > colnames(prediction) <- c("RAIN") > ул (прогноз)
    'data.frame': 7664 наблюдательных пункта. из 1 переменной:
    $ ДОЖДЬ: целое 1 2 3 4 5 6 7 8 9 10 ...
    
    #Преобразование переменной "Дождь" в символ, который хранит либо (T/F)
    прогноз $ ДОЖДЬ <- as.character (прогноз $ ДОЖДЬ)
    
    #Установка порогового значения
    прогноз $ДОЖДЬ <- "ИСТИНА"
    прогноз $ RAIN [ прогнозируемые_значения < 0.5] <- "FALSE" #prediction [прогнозируемые_значения > 0,5] <- "TRUE"
    прогноз $ ДОЖДЬ <- as.factor (прогноз $ ДОЖДЬ)
    
     

    Обратитесь к комментариям к коду, он легко понятен.

    #Сравнение прогнозируемых значений и фактических значений
    > таблица(прогноз $RAIN, test.df$RAIN)
    
    ЛОЖЬ ПРАВДА
    ЛОЖЬ    3460    931
    ИСТИНА       934    2339
    
     

    В приведенном ниже фрагменте кода мы используем матрицу путаницы для оценки точности модели.

    #Матрица путаницы
    > матрица путаницы (прогноз $ RAIN, test.df $ RAIN)
    Матрица путаницы и статистика
    
    Справка
    Прогноз ЛОЖЬ ИСТИНА
    ЛОЖЬ 3460 931
    ИСТИНА 934 2339
    
    Точность: 0,7567
    95% ДИ: (0,7469, 0,7662)
    Скорость без информации: 0,5733
    P-значение [Acc > NIR]: <2e-16
    
    Каппа: 0,5027
    
    P-значение теста Макнемара: 0,9631.
    
    Чувствительность: 0,7874
    Специфичность: 0,7153
    Позиция Пред значение: 0,7880
    Отрицательное предварительное значение: 0,7146
    Распространенность: 0,5733
    Скорость обнаружения: 0,4515
    Распространенность обнаружения: 0,5729
    Сбалансированная Точность: 0.7514
    
    «Положительный» класс: ЛОЖЬ
    
     

    Согласно приведенному выше результату, модель может прогнозировать вероятность дождя с точностью примерно 76%, что довольно хорошо. Подводя итог, давайте построим график, который показывает кривую логистической регрессии, известную как сигмовидная кривая, между предикторной переменной TMAX и целевой переменной RAIN.

    #Выходной график, показывающий разницу между TMAX и количеством осадков
    ggplot(test.df, aes(x = test.df$TMAX, y = предсказанные_значения))+
    geom_point() + # добавить точки
    geom_smooth(method = "glm", # построить регрессию...
    method.args = список (семейство = "биномиальный"))
    
     

     

    ggplot — Введение в машинное обучение — Edureka

    Теперь, когда вы знаете основы машинного обучения, я уверен, вам интересно узнать больше о различных алгоритмах машинного обучения. Вот список блогов, в которых подробно рассматриваются различные типы алгоритмов машинного обучения:

    Итак, на этом мы подошли к концу этого блога «Введение в машинное обучение». Я надеюсь, что вы все нашли этот блог информативным, а если нет, то вы также можете присоединиться к нашим программам машинного обучения в Edureka.Если у вас есть какие-либо мысли, чтобы поделиться, пожалуйста, прокомментируйте их ниже. Оставайтесь с нами, чтобы увидеть больше таких блогов!

     

    Глава 28 Введение в машинное обучение

    Пожалуй, самые популярные методологии обработки данных относятся к области машинного обучения . Истории успеха машинного обучения включают в себя считыватели рукописных почтовых индексов, внедренные почтовой службой, технологии распознавания речи, такие как Siri от Apple, системы рекомендаций фильмов, детекторы спама и вредоносных программ, предсказатели цен на жилье и беспилотные автомобили.Хотя сегодня искусственный интеллект и машинное обучение часто используются взаимозаменяемо, мы делаем следующее различие: в то время как первые алгоритмы искусственного интеллекта, такие как те, которые использовались в шахматных машинах, реализовывали принятие решений на основе программируемых правил, полученных из теории или первых принципов, в машинах решения по обучению основаны на алгоритмах , построенных с использованием данных .

    Обозначение

    В машинном обучении данные поступают в виде:

    1. результат мы хотим предсказать и
    2. функции , которые мы будем использовать для предсказания результата

    Мы хотим создать алгоритм, который принимает значения функций в качестве входных данных и возвращает прогноз для результата, когда мы не знаем результат.Подход машинного обучения состоит в том, чтобы обучить алгоритм с использованием набора данных, для которого мы знаем результат, а затем применить этот алгоритм в будущем, чтобы сделать прогноз, когда мы не знаем результат.

    Здесь мы будем использовать \(Y\) для обозначения результата и \(X_1, \dots, X_p\) для обозначения признаков. Обратите внимание, что функции иногда называют предикторами или ковариатами. Все это мы считаем синонимами.

    Задачи прогнозирования можно разделить на категориальные и непрерывные исходы.Для категориальных исходов \(Y\) может быть любым из \(K\) классов. Количество классов может сильно различаться в зависимости от приложения. Например, в данных устройства чтения цифр \(K=10\) с классами, представляющими собой цифры 0, 1, 2, 3, 4, 5, 6, 7, 8 и 9. При распознавании речи результаты все возможные слова или фразы, которые мы пытаемся обнаружить. Обнаружение спама имеет два результата: спам или не спам. В этой книге мы обозначаем категории \(K\) индексами \(k=1,\dots,K\). Однако для двоичных данных мы будем использовать \(k=0,1\) для математического удобства, которое мы продемонстрируем позже.

    Общая настройка выглядит следующим образом. У нас есть ряд функций и неизвестный результат, который мы хотим предсказать:

    .
    исход особенность 1 особенность 2 особенность 3 особенность 4 особенность 5
    ? \(Х_1\) \(Х_2\) \(Х_3\) \(Х_4\) \(Х_5\)

    Чтобы построить модель , которая обеспечивает прогноз для любого набора наблюдаемых значений \(X_1=x_1, X_2=x_2, \dots X_5=x_5\), мы собираем данные, для которых мы знаем результат:

    исход особенность 1 особенность 2 особенность 3 функция 4 особенность 5
    \(у_{1}\) \(х_{1,1}\) \(х_{1,2}\) \(х_{1,3}\) \(х_{1,4}\) \(х_{1,5}\)
    \(у_{2}\) \(х_{2,1}\) \(х_{2,2}\) \(х_{2,3}\) \(х_{2,4}\) \(х_{2,5}\)
    \(\вдоц\) \(\вдоц\) \(\вдоц\) \(\вдоц\) \(\вдоц\) \(\вдоц\)
    \(г_п\) \(х_{п,1}\) \(х_{п,2}\) \(х_{п,3}\) \(х_{п,4}\) \(х_{п,5}\)

    Когда выходные данные непрерывны, мы называем задачу машинного обучения прогнозированием , а основным выходом модели является функция \(f\), которая автоматически производит прогноз, обозначаемый как \(\hat{y }\), для любого набора предикторов: \(\hat{y} = f(x_1, x_2, \dots, x_p)\).Мы используем термин фактический результат для обозначения того, что мы в итоге наблюдали. Итак, мы хотим, чтобы предсказание \(\hat{y}\) максимально соответствовало фактическому результату \(y\). Поскольку наш результат является непрерывным, наши прогнозы \(\hat{y}\) не будут ни точно правильными, ни неправильными, но вместо этого мы определим ошибку , определяемую как разницу между прогнозом и фактическим результатом \(y - \шляпа{у}\).

    Когда результат является категориальным, мы называем задачу машинного обучения классификацией , а основным выходом модели будет решающее правило , которое предписывает, какой из \(K\) классов мы должны предсказать.В этом сценарии большинство моделей предоставляют функции предикторов для каждого класса \(k\), \(f_k(x_1, x_2, \dots, x_p)\), которые используются для принятия этого решения. Когда данные являются двоичными, типичные правила принятия решений выглядят следующим образом: если \(f_1(x_1, x_2, \dots, x_p) > C\), предсказать категорию 1, если не другую категорию, с \(C\) заранее определенным отрезать. Поскольку результаты категоричны, наши прогнозы будут либо правильными, либо неправильными.

    Обратите внимание, что эти термины различаются в зависимости от курсов, учебников и других публикаций.Часто предсказание используется как для категориальных, так и для непрерывных результатов, а термин регрессия может использоваться для непрерывного случая. Здесь мы избегаем использования регрессии , чтобы избежать путаницы с нашим предыдущим использованием термина линейной регрессии . В большинстве случаев будет ясно, являются ли наши результаты категориальными или непрерывными, поэтому мы будем избегать использования этих терминов, когда это возможно.

    Пример

    Рассмотрим пример считывателя почтовых индексов.Первый шаг в работе с почтой, поступающей в почтовое отделение, — это сортировка писем по почтовому индексу:

    .

    Первоначально людям приходилось сортировать их вручную. Для этого им приходилось читать почтовые индексы на каждой букве. Сегодня благодаря алгоритмам машинного обучения компьютер может считывать почтовые индексы, а затем робот сортирует письма. В этой части книги мы узнаем, как создавать алгоритмы, способные читать цифры.

    Первым шагом в построении алгоритма является понимание каковы результаты и особенности.Ниже представлены три изображения написанных цифр. Они уже были прочитаны человеком и присвоен результат \(Y\). Они считаются известными и служат обучающей выборкой.

    Изображения преобразуются в \(28 \times 28 = 784\) пикселей, и для каждого пикселя мы получаем интенсивность шкалы серого от 0 (белый) до 255 (черный), которую мы пока считаем непрерывной. На следующем графике показаны отдельные функции для каждого изображения:

    Для каждого оцифрованного изображения \(i\) у нас есть категориальный результат \(Y_i\), который может быть одним из 10 значений (\(0,1,2,3,4,5,6,7,8,9 \)), и функции \(X_{i,1}, \dots, X_{i,784}\).Мы используем жирный шрифт \(\mathbf{X}_i = (X_{i,1}, \dots, X_{i,784})\), чтобы отличить вектор предикторов от отдельных предикторов. Когда речь идет о произвольном наборе функций, а не о конкретном изображении в нашем наборе данных, мы опускаем индекс \(i\) и используем \(Y\) и \(\mathbf{X} = (X_{1}, \dots , X_{784})\). Мы используем переменные в верхнем регистре, потому что, как правило, мы думаем о предикторах как о случайных величинах. Мы используем нижний регистр, например \(\mathbf{X} = \mathbf{x}\), для обозначения наблюдаемых значений. Когда мы кодируем, мы придерживаемся нижнего регистра.

    Задача машинного обучения состоит в том, чтобы построить алгоритм, который возвращает прогноз для любого из возможных значений признаков. Здесь мы изучим несколько подходов к построению этих алгоритмов. Хотя на данный момент это может показаться невозможным, мы начнем с простых примеров и будем наращивать наши знания, пока не сможем перейти к более сложным. На самом деле мы начинаем с искусственно простого примера с одним предиктором, а затем переходим к несколько более реалистичному примеру с двумя предикторами.Как только мы это поймем, мы приступим к решению реальных задач машинного обучения, включающих множество предикторов.

    Упражнения

    1. Для каждого из следующих определите, является ли результат непрерывным или категоричным:

    1. Считыватель цифр
    2. Рекомендации фильмов
    3. Спам-фильтр
    4. Госпитализация
    5. Siri (распознавание речи)

    2. Сколько возможностей нам доступно для предсказания в наборе данных digits?

    3.В примере с цифровым считывателем результаты хранятся здесь:

    .
      библиотека (dslabs)
    mnist <- read_mnist()
    y <- mnist$train$labels  

    Имеют ли следующие операции практическое значение?

    Выберите лучший ответ:

    1. Да, потому что \(9 + 2 = 11\) и \(9 > 2\).
    2. Нет, потому что y не является числовым вектором.
    3. Нет, потому что 11 — это не цифра. Это две цифры.
    4. Нет, потому что это метки, представляющие категорию, а не число. 9 представляет класс, а не число 9.

    Показатели оценки

    Прежде чем мы начнем описывать подходы к оптимизации того, как мы строим алгоритмы, нам сначала нужно определить, что мы имеем в виду, когда говорим, что один подход лучше другого. В этом разделе мы сосредоточимся на описании способов оценки алгоритмов машинного обучения. В частности, нам нужно количественно определить, что мы подразумеваем под «лучше».

    Для нашего первого знакомства с концепциями машинного обучения мы начнем со скучного и простого примера: как предсказать пол по росту.Поскольку мы шаг за шагом объясняем машинное обучение, этот пример позволит нам установить первый строительный блок. Достаточно скоро мы будем атаковать более интересные задачи. Мы используем пакет Caret , который имеет несколько полезных функций для создания и оценки методов машинного обучения, и мы более подробно расскажем о них в разделе 31.

      библиотека (tidyverse)
    библиотека (вставка)  

    Для первого примера мы используем данные высоты в dslabs:

      библиотека (dslabs)
    данные(высоты)  

    Начнем с определения результата и предикторов.

      г <- высота $ секс
    x <- высота $ высота  

    В этом случае у нас есть только один предиктор, рост, и y явно является категориальным результатом, поскольку наблюдаемые значения равны либо Мужской , либо Женский . Мы знаем, что мы не сможем очень точно предсказать \(Y\) на основе \(X\), потому что средний рост мужчин и женщин не так уж отличается по сравнению с внутригрупповой изменчивостью. Но можем ли мы сделать лучше, чем гадать? Чтобы ответить на этот вопрос, нам нужно количественное определение лучшего.

    Наборы для обучения и тестирования

    В конечном итоге алгоритм машинного обучения оценивается по тому, как он работает в реальном мире с совершенно новыми наборами данных. Однако при разработке алгоритма у нас обычно есть набор данных, для которого мы знаем результаты, как и для высоты: мы знаем пол каждого ученика в нашем наборе данных. Поэтому, чтобы имитировать окончательный процесс оценки, мы обычно разделяем данные на две части и действуем так, как будто мы не знаем результата для одной из них.Мы перестаем притворяться, что не знаем результата, чтобы оценить алгоритм, но только после мы закончили его построение. Мы ссылаемся на группу, для которой мы знаем результат и используем для разработки алгоритма, как набор обучения . Мы называем группу, для которой мы делаем вид, что не знаем результата, набор тестов .

    Стандартный способ создания наборов для обучения и тестирования — это случайное разбиение данных. Пакет Caret включает функцию createDataPartition , которая помогает нам генерировать индексы для случайного разделения данных на обучающие и тестовые наборы:

      комплект.семя (2007)
    test_index <- createDataPartition (y, times = 1, p = 0,5, list = FALSE)  

    Аргумент умножить на используется для определения количества возвращаемых случайных выборок индексов, аргумент p используется для определения доли данных, представленных индексом, а аргумент список используется для определения того, мы хотим, чтобы индексы возвращались в виде списка или нет. Мы можем использовать результат вызова функции createDataPartition для определения обучающих и тестовых наборов следующим образом:

      test_set <- высоты[test_index,]
    train_set <- высоты[-test_index,]  

    Теперь мы разработаем алгоритм, используя только обучающую выборку.Как только мы закончим разработку алгоритма, мы заморозим его и оценим с помощью тестового набора. Самый простой способ оценить алгоритм, когда результаты являются категоричными, — просто указать долю случаев, которые были правильно предсказаны в тестовом наборе . Этот показатель обычно называют общей точностью .

    Общая точность

    Чтобы продемонстрировать использование общей точности, мы создадим два конкурирующих алгоритма и сравним их.

    Давайте начнем с разработки простейшего машинного алгоритма: угадывания результата.

      y_hat <- sample(c("Мужчина", "Женщина"), length(test_index), replace = TRUE)  

    Обратите внимание, что мы полностью игнорируем предиктор и просто угадываем пол.

    В приложениях машинного обучения полезно использовать факторы для представления категориальных результатов, поскольку функции R, разработанные для машинного обучения, например, в пакете , требуют или рекомендуют кодировать категориальные результаты как факторы.Итак, преобразуйте y_hat в множители, используя функцию factor :

      y_hat <- sample(c("Мужчина", "Женщина"), length(test_index), replace = TRUE) %>%
      фактор(уровни = уровни(test_set$sex))  

    Общая точность просто определяется как правильно предсказанная общая доля:

      среднее (y_hat == test_set$sex)
    #> [1] 0,51  

    Неудивительно, что наша точность составляет около 50%. Мы угадываем!

    Можем ли мы сделать лучше? Исследовательский анализ данных показывает, что мы можем, потому что в среднем мужчины немного выше женщин:

      высота %>% group_by(пол) %>% итог(среднее(рост), sd(рост))
    #> # Таблица: 2 x 3
    #> секс `mean(height)` `sd(height)`
    #>   
    #> 1 женщина 64.9 3,76
    #> 2 Мужской 69,3 3,61  

    Но как мы можем использовать это понимание? Давайте попробуем другой простой подход: предсказать Мужской , если рост находится в пределах двух стандартных отклонений от среднего мужского:

      y_hat <- ifelse(x > 62, "Мужской", "Женский") %>%
      фактор(уровни = уровни(test_set$sex))  

    Точность увеличивается с 0,50 примерно до 0,80:

      среднее (y == y_hat)
    #> [1] 0,793  

    Но можем ли мы сделать еще лучше? В приведенном выше примере мы использовали отсечку 62, но мы можем проверить точность, полученную для других отсечек, а затем выбрать значение, обеспечивающее наилучшие результаты.Но помните, важно, чтобы мы оптимизировали отсечку, используя только обучающий набор : тестовый набор предназначен только для оценки. Хотя для этого упрощенного примера это не представляет особой проблемы, позже мы узнаем, что оценка алгоритма на тренировочном наборе может привести к переоснащению , что часто приводит к опасно чрезмерно оптимистичным оценкам.

    Здесь мы проверяем точность 10 различных отсечек и выбираем ту, которая дает наилучший результат:

      отсечка <- seq(61, 70)
    точность <- map_dbl (отсечка, функция (x) {
      y_hat <- ifelse(train_set$height > x, "Мужчина", "Женщина") %>%
        фактор (уровни = уровни (test_set $ секс))
      среднее (y_hat == train_set$sex)
    })  

    Мы можем построить график, показывающий точность, полученную на тренировочном наборе для мужчин и женщин:

    Видим, что максимальное значение равно:

      макс.(точность)
    #> [1] 0.85  

    , что намного выше, чем 0,5. Отсечка, приводящая к этой точности:

      best_cutoff <- cutoff[который.max(точность)]
    best_cutoff
    #> [1] 64  

    Теперь мы можем проверить это отсечение на нашем тестовом наборе, чтобы убедиться, что наша точность не слишком оптимистична:

      y_hat <- ifelse(test_set$height > best_cutoff, "Мужской", "Женский") %>%
      фактор (уровни = уровни (test_set $ секс))
    y_hat <- фактор(y_hat)
    среднее (y_hat == test_set$sex)
    #> [1] 0.804  

    Мы видим, что она немного ниже точности, наблюдаемой для обучающей выборки, но все же лучше, чем угадывание. И, тестируя набор данных, на котором мы не тренировались, мы знаем, что наш результат не из-за выбора хорошего результата.

    Матрица путаницы

    Правило предсказания, которое мы разработали в предыдущем разделе, предсказывает Мужской , если учащийся выше 64 дюймов. Учитывая, что средний рост женщины составляет около 64 дюймов, это правило предсказания кажется неверным.Что случилось? Если студент ростом со среднюю женщину, не должны ли мы предсказать Женский ?

    Вообще говоря, общая точность может быть обманчивой мерой. Чтобы увидеть это, мы начнем с построения так называемой матрицы путаницы , которая в основном сводит в таблицу каждую комбинацию прогноза и фактического значения. Мы можем сделать это в R, используя функцию , таблицу :

    .
      таблица (прогноз = y_hat, факт = test_set$sex)
    #> фактический
    #> предсказанный Женский Мужской
    #> Женский 48 32
    #> Мужчина 71 374  

    Если мы внимательно изучим эту таблицу, она выявит проблему.Если мы посчитаем точность отдельно для каждого пола, то получим:

      test_set %>%
      мутировать (y_hat = y_hat) %>%
      group_by(пол) %>%
      суммировать (точность = среднее (y_hat == пол))
    #> # Таблица: 2 x 2
    #> точность определения пола
    #>  
    #> 1 женщина 0,403
    #> 2 шт. 0,921  

    Существует дисбаланс в точности для мужчин и женщин: слишком много женщин считаются мужчинами. Мы называем почти половину самок самцами! Как тогда наша общая точность может быть такой высокой? Это связано с тем, что распространенность мужчин в этом наборе данных высока.Эти данные о росте были получены на трех курсах по науке о данных, на два из которых было зачислено больше мужчин:

    .
      предыд. <- среднее (y == "Мужской")
    предыдущий
    #> [1] 0,773  

    Таким образом, при расчете общей точности высокий процент ошибок, сделанных для женщин, перевешивается выигрышем в правильных вызовах для мужчин. На самом деле это может быть большой проблемой в машинном обучении. Если ваши обучающие данные каким-то образом предвзяты, вы, вероятно, разработаете алгоритмы, которые также предвзяты.Тот факт, что мы использовали тестовый набор, не имеет значения, потому что он также получен из исходного смещенного набора данных. Это одна из причин, по которой при оценке алгоритма машинного обучения мы обращаем внимание не только на общую точность, но и на другие показатели.

    Существует несколько показателей, которые мы можем использовать для оценки алгоритма таким образом, чтобы распространенность не затуманивала нашу оценку, и все они могут быть получены из матрицы путаницы. Общим улучшением использования общей точности является изучение чувствительности и специфичности по отдельности.

    Чувствительность и специфичность

    Чтобы определить чувствительность и специфичность, нам нужен бинарный результат. Когда результаты являются категориальными, мы можем определить эти термины для конкретной категории. В примере с цифрами мы можем запросить специфичность в случае правильного предсказания 2, а не какой-либо другой цифры. Как только мы укажем интересующую категорию, мы можем говорить о положительных результатах \(Y=1\) и отрицательных результатах \(Y=0\).

    В общем, чувствительность определяется как способность алгоритма предсказывать положительный результат, когда фактический результат положительный: \(\hat{Y}=1\), когда \(Y=1\).Поскольку алгоритм, который называет все положительным (\(\hat{Y}=1\) несмотря ни на что), обладает идеальной чувствительностью, этой метрики самой по себе недостаточно для оценки алгоритма. По этой причине мы также исследуем специфичность , которая обычно определяется как способность алгоритма не предсказывать положительное \(\hat{Y}=0\), когда фактический результат не является положительным \(Y=0 \). Мы можем резюмировать следующим образом:

    • Высокая чувствительность: \(Y=1 \подразумевается \hat{Y}=1\)
    • Высокая специфичность: \(Y=0 \подразумевается \hat{Y} = 0\)

    Хотя вышеизложенное часто считается определением специфичности, другой способ представить специфичность — это доля положительных звонков, которые на самом деле являются положительными:

    • Высокая специфичность: \(\hat{Y}=1 \подразумевает Y=1\).

    Чтобы дать точные определения, мы назовем четыре элемента матрицы путаницы:

    На самом деле положительный На самом деле отрицательный
    Прогнозируемый положительный Истинные положительные результаты (TP) Ложные срабатывания (FP)
    Прогнозируемый отрицательный Ложноотрицательные результаты (FN) Истинные негативы (TN)

    Чувствительность обычно количественно определяется как \(TP/(TP+FN)\), доля фактических положительных результатов (первый столбец = \(TP+FN\)), которые называются положительными (\(TP\)) .Эта величина называется истинным положительным показателем (TPR) или отзывом .

    Специфичность определяется как \(TN/(TN+FP)\) или доля отрицательных результатов (второй столбец = \(FP+TN\)), которые называются отрицательными (\(TN\)). Эта величина также называется истинной отрицательной ставкой (TNR). Существует еще один способ количественной оценки специфичности: \(TP/(TP+FP)\) или доля результатов, называемых положительными (первая строка или \(TP+FP\)), которые на самом деле являются положительными (\(TP\)). ). Эта величина называется положительной прогностической ценностью (PPV) , а также точностью .Обратите внимание, что, в отличие от TPR и TNR, точность зависит от распространенности, поскольку более высокая распространенность означает, что вы можете получить более высокую точность даже при угадывании.

    Несколько названий могут сбивать с толку, поэтому мы включили таблицу, чтобы помочь нам запомнить термины. В таблице есть столбец, который показывает определение, если мы думаем о пропорциях как о вероятностях.

    чувствительность ТЭП Отзыв \(\frac{\mbox{TP}}{\mbox{TP} + \mbox{FN}}\) \(\mbox{Pr}(\шляпа{Y}=1 \mid Y=1)\)
    специфичность ТНР 1-ФПР \(\frac{\mbox{TN}}{\mbox{TN}+\mbox{FP}}\) \(\mbox{Pr}(\шляпа{Y}=0 \mid Y=0)\)
    специфичность ППВ Точность \(\frac{\mbox{TP}}{\mbox{TP}+\mbox{FP}}\) \(\mbox{Pr}(Y=1 \mid \hat{Y}=1)\)

    Здесь TPR — доля истинно положительных результатов, FPR — доля ложноположительных результатов, а PPV — положительное прогностическое значение.Функция вставки путаницаMatrix вычисляет все эти показатели для нас, как только мы определяем, какая категория является «положительной». Функция ожидает на входе факторы, и первый уровень считается положительным исходом или \(Y=1\). В нашем примере Женский является первым уровнем, потому что он предшествует Мужской в алфавитном порядке. Если вы введете это в R, вы увидите несколько показателей, включая точность, чувствительность, специфичность и PPV.

      см <- матрица путаницы (данные = y_hat, ссылка = test_set$sex)  

    Вы можете получить к ним прямой доступ, например, так:

      см$в целом["Точность"]
    #> Точность
    #> 0.804
    cm$byClass[c("Чувствительность", "Специфичность", "Распространенность")]
    #> Чувствительность Специфичность Распространенность
    #> 0,403 0,921 0,227  

    Мы видим, что высокая общая точность возможна, несмотря на относительно низкую чувствительность. Как мы намекали выше, это происходит из-за низкой распространенности (0,23): доля женщин невелика. Поскольку распространенность низкая, невозможность предсказать фактических женщин как женщин (низкая чувствительность) не снижает точность настолько, как неспособность предсказать фактических мужчин как мужчин (низкая специфичность).Это пример того, почему важно исследовать чувствительность и специфичность, а не только точность. Прежде чем применять этот алгоритм к общим наборам данных, мы должны спросить себя, останется ли распространенность такой же.

    Сбалансированная точность и \(F_1\) оценка

    Хотя мы обычно рекомендуем изучать как специфичность, так и чувствительность, очень часто бывает полезно иметь сводку из одного числа, например, в целях оптимизации. Одним из показателей, который предпочтительнее общей точности, является среднее значение специфичности и чувствительности, называемое сбалансированной точностью .Поскольку специфичность и чувствительность являются показателями, более целесообразно вычислять гармоническое среднее . На самом деле, \(F_1\)-оценка , широко используемая сводка из одного числа, является гармоническим средним значением точности и полноты:

    \[ \frac{1}{\frac{1}{2}\left(\frac{1}{\mbox{отзыв}} + \frac{1}{\mbox{точность}}\right) } \]

    Поскольку это легче записать, вы часто видите это гармоническое среднее, переписанное как:

    \[ 2 \times \frac{\mbox{точность} \cdot \mbox{отзыв}} {\mbox{точность} + \mbox{отзыв}} \]

    при определении \(F_1\).

    Помните, что в зависимости от контекста некоторые типы ошибок обходятся дороже, чем другие. Например, в случае с безопасностью самолета гораздо важнее максимизировать чувствительность, а не специфичность: неспособность предсказать неисправность самолета до того, как он потерпит крушение, является гораздо более дорогостоящей ошибкой, чем посадка самолета на землю, когда он фактически находится в аварийном состоянии. идеальное состояние. В уголовном деле об убийстве, караемом смертной казнью, все наоборот, поскольку ложное срабатывание может привести к казни невиновного человека. Оценка \(F_1\) может быть адаптирована для различного взвешивания специфичности и чувствительности.2}\frac{1}{\mbox{точность}} } \]

    Функция F_meas в пакете Caret вычисляет эту сводку с beta , по умолчанию равной 1.

    Давайте перестроим наш алгоритм предсказания, но на этот раз максимизируем F-оценку вместо общей точности:

      отсечка <- seq(61, 70)
    F_1 <- map_dbl (отсечка, функция (x) {
      y_hat <- ifelse(train_set$height > x, "Мужчина", "Женщина") %>%
        фактор (уровни = уровни (test_set $ секс))
      F_meas (данные = y_hat, ссылка = фактор (train_set $ пол))
    })  

    Как и прежде, мы можем построить эти \(F_1\) показатели в зависимости от отсечек:

    Мы видим, что он максимизируется при значении \(F_1\):

    Этот максимум достигается, когда мы используем следующую отсечку:

      best_cutoff <- cutoff[который.макс(F_1)]
    best_cutoff
    #> [1] 66  

    Отсечение 66 имеет больше смысла, чем 64. Кроме того, оно уравновешивает специфичность и чувствительность нашей матрицы путаницы:

      y_hat <- ifelse(test_set$height > best_cutoff, "Мужской", "Женский") %>%
      фактор (уровни = уровни (test_set $ секс))
    чувствительность (данные = y_hat, ссылка = test_set$sex)
    #> [1] 0,63
    специфичность (данные = y_hat, ссылка = test_set$sex)
    #> [1] 0,833  

    Теперь мы видим, что у нас получается намного лучше, чем просто угадывать, что и чувствительность, и специфичность относительно высоки, и что мы создали наш первый алгоритм машинного обучения.Он использует рост в качестве предиктора и предсказывает женщину, если ваш рост 65 дюймов или ниже.

    Распространенность имеет значение на практике

    Алгоритм машинного обучения с очень высокой чувствительностью и специфичностью может оказаться бесполезным на практике, когда распространенность близка к 0 или 1. Чтобы убедиться в этом, рассмотрим случай врача, который специализируется на редком заболевании и заинтересован в разработке алгоритма. для предсказания того, у кого есть заболевание. Врач делится с вами данными, а вы затем разрабатываете алгоритм с очень высокой чувствительностью.Вы объясняете, что это означает, что если у пациента есть заболевание, алгоритм, скорее всего, правильно предскажет. Вы также сообщаете врачу, что вы также обеспокоены тем, что, основываясь на проанализированном вами наборе данных, 1/2 пациентов имеют заболевание: \(\mbox{Pr}(\hat{Y}=1)\). Врач не обеспокоен и не впечатлен и объясняет, что важна точность теста: \(\mbox{Pr}(Y=1 | \hat{Y}=1)\). Используя теорему Байеса, мы можем соединить две меры:

    \[ \mbox{Pr}(Y = 1\mid \hat{Y}=1) = \mbox{Pr}(\hat{Y}=1 \mid Y=1) \frac{\mbox{Pr} (Y=1)}{\mbox{Pr}(\шляпа{Y}=1)}\]

    Врач знает, что распространенность заболевания составляет 5 на 1000, что означает, что \(\mbox{Pr}(Y=1) \, / \,\mbox{Pr}(\hat{Y}=1) = 1/100\) и, следовательно, точность вашего алгоритма меньше 0.01. Врачу мало пользы от вашего алгоритма.

    ROC и кривые точного восстановления

    При сравнении двух методов (угадывание и использование отсечки по высоте) мы смотрели на точность и \(F_1\). Второй метод явно превосходил первый. Однако если для второго метода мы рассмотрели несколько отсечений, то для первого мы рассмотрели только один подход: угадывание с равной вероятностью. Обратите внимание, что угадывание Мужской с более высокой вероятностью дало бы нам более высокую точность из-за систематической ошибки в выборке:

      р <- 0.9
    n <- длина (test_index)
    y_hat <- sample(c("Мужчина", "Женщина"), n, replace = TRUE, prob=c(p, 1-p)) %>%
      фактор (уровни = уровни (test_set $ секс))
    среднее (y_hat == test_set$sex)
    #> [1] 0,739  

    Но, как описано выше, это будет достигнуто за счет более низкой чувствительности. Кривые, которые мы описываем в этом разделе, помогут нам увидеть это.

    Помните, что для каждого из этих параметров мы можем получить разную чувствительность и специфичность. По этой причине очень распространенным подходом к оценке методов является их графическое сравнение путем построения обоих графиков.

    Широко используемый график, который делает это, представляет собой кривую рабочей характеристики приемника (ROC). Если вам интересно, откуда взялось это название, вы можете обратиться к Страница РПЦ в Википедии.

    Кривая ROC отображает чувствительность (TPR) в зависимости от 1 - специфичности или частоты ложноположительных результатов (FPR). Здесь мы вычисляем TPR и FPR, необходимые для различных вероятностей угадывания мужчины:

    .
      probs <- seq(0, 1, length.out = 10)
    угадывание <- map_df(probs, function(p){
      у_шляпа <-
        sample(c("Мужчина", "Женщина"), n, replace = TRUE, prob=c(p, 1-p)) %>%
        фактор(уровни = c("Женщина", "Мужчина"))
      список(метод = "Угадай",
           FPR = 1 - специфичность(y_hat, test_set$sex),
           TPR = чувствительность(y_hat, test_set$sex))
    })  

    Мы можем использовать аналогичный код для вычисления этих значений для нашего второго подхода.Построив обе кривые вместе, мы можем сравнить чувствительность для разных значений специфичности:

    Мы видим, что с этим подходом мы получаем более высокую чувствительность для всех значений специфичности, что означает, что на самом деле это лучший метод. Обратите внимание, что ROC-кривые для угадывания всегда ложатся на линию идентификации. Также обратите внимание, что при создании ROC-кривых часто бывает полезно добавить отсечку, связанную с каждой точкой.

    Пакеты pROC и plotROC полезны для создания этих графиков.

    Кривые ROC

    имеют один недостаток: ни один из нанесенных на график показателей не зависит от распространенности. В случаях, когда распространенность имеет значение, мы можем вместо этого построить график точного припоминания. Идея аналогична, но вместо этого мы строим зависимость точности от полноты:

    .

    Из этого графика сразу видно, что точность угадывания невысокая. Это связано с тем, что распространенность низкая. Мы также видим, что если мы изменим положительные значения на мужские, а не на женские, кривая ROC останется прежней, но изменится график точного отзыва.

    Функция потерь

    До сих пор мы описывали показатели оценки, которые применяются исключительно к категориальным данным. В частности, для бинарных результатов мы описали, как чувствительность, специфичность, точность и \(F_1\) можно использовать для количественной оценки. Однако эти показатели бесполезны для непрерывных результатов. В этом разделе мы описываем, как общий подход к определению «лучшего» в машинном обучении заключается в определении функции потерь , которую можно применять как к категориальным, так и к непрерывным данным.б\) результирующий прогноз, полученный в результате применения того же алгоритма к \(б\)-й случайной выборке. Опять же, на практике мы наблюдаем только одну случайную выборку, поэтому ожидаемая MSE является только теоретической. Однако в главе 30 мы описываем подход к оценке MSE, который пытается имитировать эту теоретическую величину.

    Обратите внимание, что существуют функции потерь, отличные от квадрата потерь. Например, Средняя абсолютная ошибка использует абсолютные значения, \(|\hat{Y}_i - Y_i|\) вместо возведения ошибок в квадрат. \((\шляпа{Y}_i - Y_i)^2\).Однако в этой книге мы сосредоточимся на минимизации квадратичных потерь, поскольку она наиболее широко используется.

    Условные вероятности и ожидания

    В приложениях машинного обучения мы редко можем точно предсказать результаты. Например, детекторы спама часто пропускают электронные письма, которые явно являются спамом, Siri часто неправильно понимает слова, которые мы говорим, а ваш банк иногда думает, что ваша карта была украдена, хотя это не так. Самая распространенная причина невозможности построить совершенные алгоритмы заключается в том, что это невозможно.Чтобы увидеть это, обратите внимание, что большинство наборов данных будут включать группы наблюдений с одинаковыми точными наблюдаемыми значениями для всех предикторов, но с разными результатами. Поскольку наши правила прогнозирования являются функциями, равные входные данные (предикторы) предполагают равные выходные данные (прогнозы). Следовательно, для задачи, в которой одни и те же предикторы связаны с разными результатами в разных отдельных наблюдениях, невозможно правильно предсказать для всех этих случаев. Мы видели простой пример этого в предыдущем разделе: для любого заданного роста \(x\) у вас будут как самцы, так и самки ростом \(x\) дюймов.

    Однако ничто из этого не означает, что мы не можем построить полезные алгоритмы, которые намного лучше, чем угадывание, а в некоторых случаях лучше, чем мнения экспертов. Чтобы добиться этого оптимальным образом, мы используем вероятностные представления проблемы, основанные на идеях, представленных в разделе 18.3. Наблюдения с одинаковыми наблюдаемыми значениями предикторов могут не быть одинаковыми, но мы можем предположить, что все они имеют одинаковую вероятность того или иного класса. Мы запишем эту идею математически для случая категориальных данных.

    Условные вероятности

    Мы используем обозначение \((X_1 = x_1,\dots,X_p=x_p)\) для представления того факта, что мы наблюдаем значения \(x_1,\dots,x_p\) для ковариат \(X_1, \dots, X_p \). Это не означает, что результат \(Y\) будет иметь определенное значение. Вместо этого он подразумевает конкретную вероятность. В частности, обозначим условных вероятностей для каждого класса \(k\):

    \[ \mbox{Pr}(Y=k \mid X_1 = x_1,\dots,X_p=x_p), \, \mbox{for}\,k=1,\dots,K \]

    Чтобы не записывать все предикторы, мы будем использовать жирные буквы следующим образом: \(\mathbf{X} \equiv (X_1,\dots,X_p)\) и \(\mathbf{x} \equiv (x_1, \точки,x_p)\).Мы также будем использовать следующие обозначения для условной вероятности принадлежности к классу \(k\):

    .

    \[ p_k(\mathbf{x}) = \mbox{Pr}(Y=k \mid \mathbf{X}=\mathbf{x}), \, \mbox{for}\, k=1,\dots,K \]

    Примечание. Мы будем использовать нотацию \(p(x)\) для представления условных вероятностей как функций предикторов. Не путайте его с \(p\), который представляет количество предикторов.

    Эти вероятности определяют построение алгоритма, который делает лучший прогноз: для любого данного \(\mathbf{x}\) мы предскажем класс \(k\) с наибольшей вероятностью среди \(p_1(x), p_2(x), \dots p_K(x)\).В математической записи мы записываем это так: \(\hat{Y} = \max_k p_k(\mathbf{x})\).

    В машинном обучении мы называем это правилом Байеса . Но имейте в виду, что это теоретическое правило, поскольку на практике мы не знаем \(p_k(\mathbf{x}), k=1,\dots,K\). Фактически, оценку этих условных вероятностей можно рассматривать как основную задачу машинного обучения. Чем лучше наши оценки вероятности \(\hat{p}_k(\mathbf{x})\), тем лучше наш предиктор:

    \[\шляпа{Y} = \max_k \шляпа{p}_k(\mathbf{x})\]

    То, что мы будем предсказывать, зависит от двух вещей: 1) насколько близки \(\max_k p_k(\mathbf{x})\) к 1 или 0 (полная достоверность) и 2) насколько наши оценки \(\hat{p}_k(\mathbf{x})\) близки к \(p_k(\mathbf{x})\).Мы ничего не можем сделать с первым ограничением, поскольку оно определяется характером проблемы, поэтому наша энергия уходит на поиск способов наилучшей оценки условных вероятностей. Первое ограничение означает, что у нас есть пределы того, насколько хорошо может работать даже самый лучший из возможных алгоритмов. Вы должны привыкнуть к мысли, что хотя в некоторых задачах мы сможем достичь почти идеальной точности, например, с цифровыми считывателями, в других наш успех ограничен случайностью процесса, например, с рекомендациями фильмов.

    Прежде чем мы продолжим, важно помнить, что определение нашего прогноза путем максимизации вероятности не всегда оптимально на практике и зависит от контекста. Как обсуждалось выше, чувствительность и специфичность могут различаться по важности. Но даже в этих случаях хорошей оценки \(p_k(x), k=1,\dots,K\) будет достаточно для построения оптимальных моделей прогнозирования, поскольку мы можем контролировать баланс между специфичностью и чувствительностью, однако мы желаем. Например, мы можем просто изменить пороговые значения, используемые для предсказания того или иного исхода.В примере с самолетом мы можем заземлить самолет в любое время, когда вероятность неисправности выше 1 на миллион, в отличие от 1/2 по умолчанию, используемого, когда типы ошибок одинаково нежелательны.

    Условные ожидания

    Для двоичных данных вероятность \(\mbox{Pr}(Y=1 \mid \mathbf{X}=\mathbf{x})\) можно представить как долю единиц в страте населения для что \(\mathbf{X}=\mathbf{x}\). Многие алгоритмы, которые мы изучим, могут применяться как к категориальным, так и к непрерывным данным благодаря связи между условными вероятностями и условными ожиданиями .

    Поскольку ожидание представляет собой среднее значение \(y_1,\dots,y_n\) в совокупности, в случае, когда \(y\)s равны 0 или 1, ожидание эквивалентно вероятности случайного выбора единица, так как среднее значение — это просто пропорция единиц:

    \[ \mbox{E}(Y \mid \mathbf{X}=\mathbf{x})=\mbox{Pr}(Y=1 \mid \mathbf{X}=\mathbf{x}). \]

    В результате мы часто используем ожидание только для обозначения как условной вероятности, так и условного ожидания.

    Как и в случае с категориальными результатами, в большинстве приложений одни и те же наблюдаемые предикторы не гарантируют одни и те же непрерывные результаты. Вместо этого мы предполагаем, что результат следует тому же условному распределению. Теперь мы объясним, почему мы используем условное ожидание для определения наших предикторов.

    Условное математическое ожидание минимизирует квадрат функции потерь

    Почему нас волнует условное ожидание в машинном обучении? Это связано с тем, что ожидаемое значение имеет привлекательное математическое свойство: оно минимизирует MSE.2 \mid \mathbf{X}=\mathbf{x} \} \]

    Благодаря этому свойству краткое описание основной задачи машинного обучения заключается в том, что мы используем данные для оценки:

    \[ f(\mathbf{x}) \equiv \mbox{E}( Y \mid \mathbf{X}=\mathbf{x} ) \]

    для любого набора признаков \(\mathbf{x} = (x_1, \dots, x_p)\). Конечно, это легче сказать, чем сделать, поскольку эта функция может принимать любую форму, а \(p\) может быть очень большим. Рассмотрим случай, когда у нас есть только один предиктор \(x\). Математическое ожидание \(\mbox{E}\{ Y \mid X=x \}\) может быть любой функцией \(x\): линией, параболой, синусоидой, ступенчатой ​​функцией, чем угодно.Это становится еще более сложным, когда мы рассматриваем экземпляры с большими \(p\), и в этом случае \(f(\mathbf{x})\) является функцией многомерного вектора \(\mathbf{x}\). Например, в нашем примере с считывателем цифр \(p = 784\)! Основным отличием конкурирующих алгоритмов машинного обучения является их подход к оценке этого ожидания.

    Практический пример: это 2 или 7?

    В двух простых примерах выше у нас был только один предиктор. На самом деле мы не рассматриваем эти проблемы машинного обучения, для которых характерны случаи со многими предикторами.Вернемся к примеру с цифрами, в котором у нас было 784 предиктора. В иллюстративных целях мы начнем с упрощения этой задачи до задачи с двумя предикторами и двумя классами. В частности, мы определяем задачу как создание алгоритма, который может определить, является ли цифра 2 или 7 из предикторов. Мы не совсем готовы строить алгоритмы с 784 предикторами, поэтому извлечем из 784 два простых предиктора: долю темных пикселей, находящихся в верхнем левом квадранте (\(X_1\)) и нижнем правом квадранте (\( Х_2\)).

    Затем мы выбираем случайную выборку из 1000 цифр, 500 в обучающем наборе и 500 в тестовом наборе. Мы предоставляем этот набор данных в пакете dslabs :

      библиотека (tidyverse)
    библиотека (dslabs)
    данные ("mnist_27")  

    Мы можем изучить данные, нанеся на график два предиктора и используя цвета для обозначения меток:

      mnist_27$train %>% ggplot(aes(x_1, x_2, цвет = y)) + geom_point()  

    Мы можем сразу увидеть некоторые закономерности.Например, если \(X_1\) (верхняя левая панель) очень велика, то цифра, вероятно, равна 7. Кроме того, для меньших значений \(X_1\) двойки кажутся средними значениями диапазона \(Х_2\).

    Чтобы проиллюстрировать, как интерпретировать \(X_1\) и \(X_2\), мы включили четыре примера изображений. Слева исходные изображения двух цифр с наибольшим и наименьшим значением для \(X_1\), а справа у нас есть изображения, соответствующие наибольшему и наименьшему значению \(X_2\):

    Мы можем начать понимать, почему эти предикторы полезны, но также и почему проблема будет несколько сложной.

    На самом деле мы еще не изучили никаких алгоритмов, поэтому давайте попробуем построить алгоритм с помощью регрессии. Модель просто:

    \[ p(x_1, x_2) = \mbox{Pr}(Y=1 \mid X_1=x_1 , X_2 = x_2) = \бета_0 + \бета_1 х_1 + \бета_2 х_2 \]

    Подгоняем так:

      подходит <- mnist_27$train %>%
      мутировать (y = ifelse (y == 7, 1, 0)) %>%
      lm(y ~ x_1 + x_2, данные = .)  

    Теперь мы можем построить правило принятия решения на основе оценки \(\hat{p}(x_1, x_2)\):

      библиотека(вставки)
    p_hat <- прогнозировать (подходит, новые данные = mnist_27 $ тест)
    y_hat <- factor(ifelse(p_hat > ​​0.5, 7, 2))
    матрица путаницы(y_hat, mnist_27$test$y)$overall[["Точность"]]
    #> [1] 0,75  

    Мы получаем точность намного выше 50%. Неплохо для нашей первой попытки. Но можем ли мы сделать лучше?

    Поскольку мы построили пример mnist_27 и в нашем распоряжении было 60 000 цифр только в наборе данных MNIST, мы использовали его для построения истинного условного распределения \(p(x_1, x_2)\). Имейте в виду, что это то, к чему у нас нет доступа на практике, но мы включили его в этот пример, потому что это позволяет сравнивать \(\hat{p}(x_1, x_2)\) с истинным \(p (х_1, х_2)\).Это сравнение учит нас ограничениям различных алгоритмов. Давайте сделаем это здесь. Мы сохранили истинное значение \(p(x_1,x_2)\) в объекте mnist_27 и можем построить изображение, используя функцию ggplot2 geom_raster() . Мы выбираем лучшие цвета и используем функцию stat_contour , чтобы нарисовать кривую, которая разделяет пары \((x_1,x_2)\), для которых \(p(x_1,x_2) > 0,5\), и пары, для которых \(p(x_1 ,x_2) < 0,5\):

      mnist_27$true_p %>% ggplot(aes(x_1, x_2, z = p, fill = p)) +
      геом_растр() +
      scale_fill_gradientn(colors=c("#F8766D", "белый", "#00BFC4")) +
      stat_contour(разрывы=c(0.5), цвет = "черный")  

    Выше вы видите график истинного \(p(x,y)\). Чтобы начать понимать ограничения логистической регрессии здесь, сначала обратите внимание, что при логистической регрессии \(\hat{p}(x,y)\) должна быть плоскостью, и в результате граница, определяемая решающим правилом, задается выражением : \(\hat{p}(x,y) = 0,5\), из чего следует, что граница не может быть ничем иным, как прямой линией:

    \[ \hat{\beta}_0 + \hat{\beta}_1 x_1 + \hat{\beta}_2 x_2 = 0,5 \подразумевается \hat{\beta}_0 + \hat{\beta}_1 x_1 + \hat{\beta}_2 x_2 = 0.5 \ подразумевает x_2 = (0,5-\шляпа{\бета}_0)/\шляпа{\бета}_2 -\шляпа{\бета}_1/\шляпа{\бета}_2 x_1 \] Обратите внимание, что для этой границы \(x_2\) является линейной функцией \(x_1\). Это означает, что у нашего подхода логистической регрессии нет шансов уловить нелинейный характер истинного \(p(x_1,x_2)\). Ниже приведено визуальное представление \(\hat{p}(x_1, x_2)\). Мы использовали функцию squish из пакета Scales , чтобы ограничить оценки значениями от 0 до 1. Мы можем увидеть, где были допущены ошибки, также показав данные и границу.В основном они исходят из низких значений \(x_1\), которые имеют либо высокое, либо низкое значение \(x_2\). Регрессия не может этого уловить.

    Нам нужно что-то более гибкое: метод, который позволяет оценивать формы, отличные от плоскости.

    Мы изучим несколько новых алгоритмов, основанных на разных идеях и концепциях. Но их всех объединяет то, что они допускают более гибкие подходы. Мы начнем с описания подходов ближайшего соседа и ядра. Чтобы представить концепции, лежащие в основе этих подходов, мы снова начнем с простого одномерного примера и опишем концепцию сглаживания .

    Введение в машинное обучение [издание 2021 г.]

    Машинное обучение (МО) — одна из самых обсуждаемых тем в мире технологий. К настоящему времени вы, должно быть, слышали об этом. Если вы уже знакомы с основами машинного обучения и ноу-хау, а также с тем, где они используются, эта статья дополнит эти знания. Если вы новичок в машинном обучении, основы, описанные в этом руководстве, помогут вам освоиться.

    БЕСПЛАТНЫЙ курс по машинному обучению
    Сделайте первый шаг к успеху в области машинного обученияЗарегистрируйтесь сейчас

    Жизнь без машинного обучения

    Прежде всего, давайте начнем это вводное руководство по машинному обучению с рассмотрения того, какой была жизнь до появления машинного обучения, и всех изменений, которые оно произвело до сих пор!

    Тот, кто ничего не знает об основах машинного обучения или искусственном интеллекте (ИИ), может думать только о роботах или машинах, как это изображают в научных фильмах.Но большинство людей не знают, как общие основы машинного обучения используются в нашей повседневной жизни. Некоторые примеры включают:

    Поиск в Google 

    Люди обычно обращаются к поисковым системам, таким как Google, за разнообразной информацией и ответами. Поисковая система собирает всю информацию на основе вашего поискового запроса и представляет наиболее релевантные результаты. Без Google задача была бы утомительной, так как вам пришлось бы просмотреть десятки или сотни книг и статей.

    Распознавание голоса и лица 

    В какой-то момент распознавание лиц было только концепцией, показанной в фильмах. Но машинное обучение сделало это возможным, и теперь многие используют эту функцию в своих интересах. Например, Facebook автоматически распознает людей на фотографии и отмечает их для вас, экономя много времени. Без машинного обучения Siri, Cortana или Iris не смогли бы ответить на ваши вопросы.

    БЕСПЛАТНЫЙ курс по машинному обучению
    Освойте востребованные навыки и инструменты машинного обученияЗарегистрируйтесь сейчас

    Основы машинного обучения — использование машинного обучения в повседневной жизни

    Виртуальная реальность в мире игр 

    PS4 и Xbox представили очки виртуальной реальности, которые привносят в игры совершенно новый уровень детализации.Каждый раз, когда ваша голова движется в реальном мире, она повторяет движения в виртуальном мире, обеспечивая отличный игровой опыт.

    Машинное обучение также играет роль в управлении жестами, отслеживая движения тела и совершая соответствующие движения в игре.

    Наконец, в играх FIFA ваш противник имеет тенденцию адаптироваться в зависимости от стратегии или игрового процесса, которому вы следуете, и все благодаря машинному обучению.

    Интернет-магазины 

    Далее во введении в учебник по машинному обучению идет очень интересный момент, а именно онлайн-покупки! Люди, которые делают покупки на Amazon, обычно замечают множество предложений продуктов.Если вы покупаете официальную рубашку, Amazon предлагает официальную обувь, галстуки, блейзеры и одежду, которые подходят к тому, что вы покупаете. Машинное обучение — это то, что приводит в действие эту систему рекомендаций.

    Машинное обучение также играет роль в сегментации клиентов, что является важным аспектом успеха в бизнесе для всех платформ электронной коммерции. Машинное обучение помогает платформам электронной коммерции различать клиентов на основе того, что они покупают, как часто они покупают и их отзывов. Это помогает компаниям обеспечить заботу о своих клиентах и ​​удовлетворение их потребностей.

    Поездка на работу (Uber)

    Вероятно, вы часто пользуетесь Uber, чтобы вовремя добраться до разных мест. Uber использует машинное обучение несколькими способами, например: 

    .
    • Предложение точек высадки и посадки: После того, как вы путешествовали с Uber, вы увидите, что приложение предлагает другие места, которые вы, возможно, захотите посетить, на основе ваших предыдущих поездок.
    • Uber Share: когда вы совершаете совместную поездку, приложение гарантирует, что автомобиль, который вы получаете, используется совместно с клиентами, путешествующими по тому же маршруту, по которому вы едете на работу.Приложение использует машинное обучение для сортировки различных факторов, таких как расстояние, трафик и рейтинги, перед распределением транспортных средств.

    Теперь, когда вы знаете, как машинное обучение используется в повседневной жизни, давайте узнаем об основах машинного обучения в следующем разделе нашего вводного руководства по машинному обучению.

    Что такое машинное обучение?

    Машинное обучение — это приложение ИИ, которое предоставляет системам возможность учиться самостоятельно и совершенствоваться на основе полученного опыта без внешнего программирования.Если бы ваш компьютер имел машинное обучение, он мог бы играть в сложные части игры или решать за вас сложное математическое уравнение.

    Как работает машинное обучение

    Рассмотрим систему с входными данными, которая содержит фотографии различных видов фруктов. Вы хотите, чтобы система группировала данные по разным видам фруктов.

    Сначала система проанализирует входные данные. Затем он пытается найти шаблоны, такие как формы, размер и цвет.На основе этих шаблонов система попытается предсказать различные типы фруктов и разделить их. Наконец, он отслеживает все решения, принятые в ходе процесса, чтобы обеспечить обучение. В следующий раз, когда вы попросите ту же систему предсказать и разделить разные типы фруктов, ей не придется повторять весь процесс заново. Так работает машинное обучение.

    Программа последипломного образования в области искусственного интеллекта и машинного обучения
    Совместно с Университетом ПердьюИзучить курс

    Основы машинного обучения — типы машинного обучения 

    Говоря об основах машинного обучения, вы должны знать, что оно состоит из трех разных типов:

    • Контролируемое машинное обучение: вы контролируете машину, обучая ее самостоятельной работе.Для этого требуются помеченные обучающие данные
    • .
    • Неконтролируемое обучение: есть данные обучения, но они не будут помечены
    • Обучение с подкреплением: система обучается самостоятельно

    Обучение под наблюдением 

    Чтобы понять, как работает обучение с учителем, посмотрите на приведенный ниже пример, где вам нужно обучить модель или систему распознавать яблоко.

    Во-первых, вы должны предоставить набор данных, содержащий изображения фруктов, например, яблок.

    Затем предоставьте другой набор данных, который позволит модели понять, что это изображения яблок. На этом этап обучения завершается.

    Затем укажите новый набор данных, содержащий только изображения яблок. В этот момент система может распознать, что это за фрукт, и запомнит его.

    Так работает контролируемое обучение. Вы обучаете модель выполнять определенную операцию самостоятельно. Такая модель часто используется для фильтрации спама из ваших учетных записей электронной почты.

    Обучение без учителя

    Рассмотрим загроможденный набор данных: набор изображений различных фруктов. Вы вводите эти данные в модель, и модель анализирует их, чтобы распознать любые закономерности. В конце машина классифицирует фотографии на три типа, как показано на изображении, на основе их сходства. Flipkart использует эту модель для поиска и рекомендации продуктов, которые вам подходят.

    Обучение с подкреплением 

    Вы предоставляете машине набор данных и просите ее идентифицировать определенный вид фруктов (в данном случае яблоко).Машина говорит вам, что это манго, но это неправильный ответ. В качестве обратной связи вы сообщаете системе, что она неверна; это не манго, это яблоко. Затем машина учится на обратной связи и помнит об этом. В следующий раз, когда вы зададите тот же вопрос, система даст вам правильный ответ; он может сказать вам, что это яблоко. Это усиленный ответ.

    Так работает обучение с подкреплением; система учится на своих ошибках и опыте. Эта модель используется в таких играх, как Prince of Persia, Assassin’s Creed и FIFA, где уровень сложности увеличивается по мере того, как вы становитесь лучше в играх.

    Сравнение контролируемого и неконтролируемого обучения

    Контролируемое и неконтролируемое обучение различаются по нескольким параметрам:

    Во-первых, данные, используемые в обучении с учителем, помечаются. В приведенных выше примерах вы предоставляете системе фотографию яблока и сообщаете системе, что это яблоко. Это называется размеченными данными. Система учится на размеченных данных и делает прогнозы на будущее. С другой стороны, неконтролируемое обучение не требует каких-либо помеченных данных, потому что его работа заключается в поиске закономерностей во входных данных и их организации.

    Во-вторых, вы получаете обратную связь в случае контролируемого обучения. То есть, как только вы получаете вывод, система запоминает его и использует для следующей операции. Этого не происходит при неконтролируемом обучении.

    Наконец, обучение с учителем в основном используется для прогнозирования данных, тогда как обучение без учителя используется для поиска скрытых закономерностей или структур в данных.

    Как выбрать правильное решение для машинного обучения?

    Это вопрос, на который вам нужно ответить, прежде чем создавать модель машинного обучения.

    Выбор правильного типа решения для вашей модели очень важен, чтобы избежать потери большого количества времени, энергии и затрат на обработку.

    Ниже приведены факторы, которые помогут вам выбрать правильное решение для машинного обучения на основе контролируемого, неконтролируемого обучения и обучения с подкреплением:

    1. Представьте, что вы хотите предсказать будущие цены на фондовом рынке. Если вы новичок в машинном обучении, вам будет сложно найти правильное решение.Но со временем и практикой вы начнете понимать, что для такой постановки задачи обучение с учителем, основанное на решении, будет работать лучше всего по очевидным причинам.
    2. Размер, качество и характер данных также являются важными факторами. Если данные загромождены, вы выберете неконтролируемый. Если набор данных обширен и категоричен, выберите решения для контролируемого обучения.
    3. Наконец, вы должны выбрать решение, основанное на сложности алгоритма. Что касается постановки задачи, где вы прогнозируете цены на фондовом рынке, использование обучения с подкреплением может быть решением, хотя это было бы сложно и требует много времени, в отличие от обучения с учителем.

    Алгоритмы основ машинного обучения

    Алгоритмы не являются типами машинного обучения. Проще говоря, это методы решения конкретной проблемы.

    Классификация 

    Первый метод — это классификация, и он относится к обучению с учителем. Классификация используется, когда вы ищете результат «да» или «нет», или в форме «а» или «б», или «верно», или «ложно».

    Например, если владелец магазина хочет предсказать, вернется ли конкретный покупатель в его магазин или нет, он будет использовать алгоритм классификации.Примеры алгоритмов классификации включают: 

    • Дерево решений 
    • Наивный Байес
    • Случайный лес
    • Логистическая регрессия 
    • K-ближайший сосед (KNN)

    Регрессия

    Этот метод используется, когда прогнозируемые данные являются числовыми. Если владелец магазина хочет предсказать цену товара на основе спроса, он выберет регрессию.

    Кластеризация

    Кластеризация — это тип обучения без учителя, который используется, когда данные необходимо упорядочить.Flipkart, Amazon и другие интернет-магазины используют кластеризацию для своих систем рекомендаций. Поисковые системы также используют кластеризацию для анализа вашей истории поиска, чтобы определить ваши предпочтения и предоставить вам наилучшие результаты поиска. Одним из алгоритмов, подпадающих под кластеризацию, является метод K-средних.

    В следующем разделе вводного руководства по машинному обучению мы узнаем о наиболее распространенных алгоритмах машинного обучения.

    4 наиболее распространенных алгоритма машинного обучения

    К четырем наиболее часто используемым алгоритмам машинного обучения относятся:

    • K-ближайший сосед
    • Линейная регрессия 
    • Дерево решений 
    • Наивный Байес

    K-ближайший сосед

    K-ближайший сосед — это тип алгоритма классификации, в котором сходные точки данных образуют кластеры, и эти кластеры используются для идентификации новых неизвестных объектов.На изображении ниже есть три разных кластера: синий, красный и зеленый.

    Если вы получаете новую и неизвестную точку данных, она классифицируется на основе ближайшего к ней или наиболее похожего на нее кластера. K в KNN — это количество ближайших соседних точек данных, с которыми мы хотим сравнить неизвестные данные. Рассмотрим пример ниже: 

    На графике отношения стоимости к долговечности есть три кластера: футбольные мячи, теннисные мячи и баскетбольные мячи. Из графика мы можем сделать вывод, что:

    • Стоимость футбольных мячей высока, а долговечность низкая
    • Теннисные мячи отличаются высокой прочностью, но низкой стоимостью
    • Стоимость баскетбольных мячей равна прочности

    Рассмотрим неизвестную точку данных: черное пятно, которое может быть одной из классификаций шаров.

    Мы пытаемся классифицировать это с помощью KNN. Если вы возьмете k = 5, нарисуйте круг, удерживая неизвестную точку данных в центре, и убедитесь, что у вас есть пять шаров внутри этого круга.

    После того, как вы начертите круг, внутри него окажется один футбольный, один баскетбольный и три теннисных мяча. Поскольку внутри круга находится наибольшее количество теннисных мячей, этот мяч будет считаться теннисным. Вот как выполняется классификация k-ближайших соседей.

    Линейная регрессия

    Линейная регрессия — это тип алгоритма обучения с учителем, используемый для установления линейной зависимости между переменными, одна из которых будет зависимой, а другая — независимой.Если вы хотите предсказать вес человека на основе его роста, вес будет зависимой переменной, а рост будет независимой.

    См. следующий пример:

    Выделитесь среди своих сверстников в этом сезоне аттестации
    Начните учиться на наших БЕСПЛАТНЫХ курсахЗарегистрируйтесь сейчас

    Рассмотрим график, показывающий зависимость между ростом и весом человека. Ось Y представляет собой высоту, а ось X представляет вес. Зеленые точки — это различные точки данных, а «d» — среднеквадратическая ошибка, которая представляет собой перпендикулярное расстояние от линии до точек данных или значения ошибки.Эта ошибка показывает, насколько прогнозируемые значения отличаются от исходного значения.

    Пока не обращайте внимания на синюю линию и нарисуйте новую линию регрессии. Вы можете увидеть расстояние от всех точек данных до новой линии. Если принять новую линию за линию регрессии, ошибка прогноза будет слишком велика. В этом случае модель не сможет дать вам точный прогноз.

    Продемонстрируем то же самое с другой линией регрессии, как показано ниже.Даже в этом случае перпендикулярное расстояние точек данных от линии очень велико, что означает, что значение ошибки все еще слишком велико. Эта модель также не даст вам точного прогноза.

    Наконец, вы рисуете линию (синюю линию), которая отображает расстояние точек данных от линии, которая намного меньше по сравнению с двумя другими линиями, которые вы нарисовали. Значение «d» для синей линии регрессии будет намного меньше и, следовательно, точнее. Если вы присвоите какое-либо значение оси x, соответствующее значение оси y будет вашим прогнозом.Учитывая тот факт, что «d» очень низкое, ваш прогноз должен быть точным.

    Вот как работает регрессия; вы рисуете линию регрессии таким образом, чтобы значение «d» было наименьшим, что в конечном итоге дает вам точные прогнозы.

    Дерево решений

    Дерево решений — это алгоритм, который может быть полезен людям, поскольку часто мы сами принимаем решения. Он использует метод ветвления для понимания проблемы и принятия решений на основе условий.

    Представьте, что вы сидите дома и думаете о том, чтобы пойти поплавать. Вы проверяете, солнечно ли на улице: это ваше первое условие. Если ответ на это условие «да», вы идете плавать. Если не солнечно, следующий вопрос, который вы задаете: «Идет ли дождь?» Это второе условие. Если идет дождь, вы отменяете свои планы и остаетесь дома. В противном случае вы бы вышли на улицу и прогулялись. Это последний узел.

    Так работает алгоритм дерева решений. Вы, вероятно, используете это каждый день, чтобы принимать решения, основанные на ответах на несколько условий.

    Наивный байесовский анализ

    Наивный байесовский метод в основном используется в тех случаях, когда необходимо сделать прогноз на основе большого набора данных. Он использует условную вероятность — вероятность того, что событие, скажем, «А», произойдет при условии, что другое событие, «Б», уже произошло.

    Пример 1. Фильтрация нежелательной почты 

    Этот алгоритм чаще всего используется для фильтрации спама в вашей учетной записи электронной почты.

    Когда вы получаете электронное письмо, модель просматривает ваши старые записи электронной почты со спамом.Затем он использует теорему Байеса, чтобы предсказать, является ли входящее электронное письмо спамом или нет.

    P (C/A) — вероятность того, что событие «C» произойдет, когда «A» уже произошло.

    P (A/C) — вероятность того, что событие «A» произойдет, когда «C» уже произошло.

    P(C) — вероятность наступления события «C».

    P(A) — вероятность наступления события «А».

    Пример 2. Предсказание игры в крикет

    В другом примере наивный байесовский метод можно использовать для определения дней, в которые можно играть в крикет.Основываясь на вероятности того, что день будет дождливым, ветреным или солнечным, модель сообщает вам, возможен ли матч по крикету. Если вы считаете все погодные условия «событием А», а вероятность возможного матча — «событием С», модель применяет вероятности событий А и С к теореме Байеса и предсказывает, возможна ли игра в крикет на конкретный день или нет. В этом случае, если вероятность C/A больше 0,5, то можно играть в крикет. Если он меньше 0,5, вы не сможете.

    Программа последипломного образования в области искусственного интеллекта и машинного обучения
    Совместно с Университетом ПердьюИзучить курс

    Практический пример использования: прогнозирование цены дома с использованием основ машинного обучения

    В этом разделе вводного руководства по машинному обучению мы обсудим несколько удивительных вариантов использования машинного обучения. Этот вариант использования касается прогнозирования цены дома с использованием основ машинного обучения. В этом примере человек планирует продать свой дом, но не может определиться с продажной ценой.

    Постановка задачи — «предсказать цену дома, используя основы машинного обучения, реализованные на Python».

    Какой алгоритм следует использовать для этого варианта использования?

    Для этой задачи мы используем линейную регрессию, которая является типом контролируемого обучения. Он лучше других алгоритмов, потому что:  

    • Вывод является количественным и прямо пропорционален переменным. Как упоминалось ранее, если прогноз количественный, линейная регрессия — лучший выбор
    • .
    • Вторая причина — низкая стоимость вычислений.Это означает, что если вы используете алгоритм, который включает в себя множество решений уравнений, вам понадобится привлекательная система, а это обойдется вам дороже. Однако это не относится к линейной регрессии, которая представляет собой очень простой алгоритм, который можно реализовать в любой нормальной системе
    • .
    • Наконец, линейную регрессию легко понять

    Переменные данных варианта использования

    Ваш набор данных имеет следующие особенности; вам нужно принять их во внимание, чтобы спрогнозировать цену дома: 

    • Низкий статус населения в этом районе
    • Средняя цена всех домов в этом районе
    • Возраст дома
    • Налоговая ставка
    • Среднее количество комнат в каждом доме
    • Расстояние до пяти рабочих мест в Бостоне
    • Доступ к автомагистралям 
    • Уровень преступности на душу населения

    Как работает линейная регрессия

    Вот как работает линейная регрессия: 

    Вы предоставите своей модели (компьютеру) обучающие данные (все функции/переменные данных), чтобы она могла учиться на них.Затем вы предоставите своей модели тестовые данные, то есть конкретные значения, которые необходимо предсказать. На основе полученных обучающих данных он сможет предсказать цену дома.

    Реализовать модель на Python  

    Чтобы реализовать всю модель на Python, мы используем: 

    • Блокнот Jupyter для запуска кода
    • Scikit-научитесь загружать все данные и библиотеки. Scikit-learn — это библиотека, специально предназначенная для машинного обучения, если вы программируете на Python 
    • .
    1. Начните с импорта необходимых библиотек для модели из scikit-learn.

    Сначала идет NumPy, поддержка больших массивов и матриц, которые мы будем использовать в этом случае использования.

    Затем идет Pandas, пакет, упрощающий работу с реляционными данными.

    Далее идет модель регрессии, которую мы собираемся использовать.

    Чтобы проверить точность модели, мы импортируем разделение тестов поезда.

    Теперь нажмите Shift + Enter, чтобы запустить ячейку.

    2.Загрузите набор данных Бостона из scikit-learn

    .

    Нажмите Shift + Enter, чтобы запустить ячейку.

    3. Посмотрите на набор данных

    Введите «Бостон» и нажмите Enter. Вы должны увидеть весь набор данных.

    4. Разделить данные на два разных фрейма данных 

    Здесь в игру вступает библиотека Pandas. Все целевые значения будут загружены во фрейм данных df_y. Запустите ячейку.

    5. Опишите данные

    В этой таблице указано количество каждого признака, среднее значение для каждого признака и стандартное отклонение.

    6. Применить линейную регрессию 

    Нажмите Shift + введите

    7. Разделите данные на обучающие и тестовые данные для проверки модели 

    Примечание. Размер равен 0,2, что означает, что 20 процентов — это тестовые данные, а остальное — обучение. Случайное состояние необходимо при многократном запуске и проверке нашей модели.

    8. Подгонка данных под функцию регрессии

    Нажмите Shift+Enter

    Вы видите, что набор данных соответствует функции, которую вы вызвали ранее (строка 14 на нашем рисунке).

    9. Проверить коэффициенты

    Нажмите Shift+Enter, и вы получите этот вывод

    Коэффициенты дают нам представление о том, насколько увеличится зависимая переменная, если значение независимой переменной увеличится на единицу. Например, если вы возьмете уравнение линии, скажем, с линией регрессии y = mx + c, C — константа, а M — коэффициент в этом случае.

    10. Прогноз цен

    Переменная «а» — прогнозируемая цена.Это будет прогнозировать цены в соответствии с массивами. Нажмите Shift+Enter.

    Далее введите номер массива. Число в скобках (строка 19 на изображении ниже) указывает номер массива. В этом примере массив равен трем. После нажатия клавиши ввода возвращается значение массива 18. 15. Затем проверьте тестовые данные, чтобы подтвердить значение для массива номер три. В данном случае это 19,3. Вы можете видеть, что прогнозируемое значение и исходное значение не сильно различаются; прогнозы довольно хорошие.

    Давайте проверим другой массив, и в этом примере мы будем использовать номер пять. В тестовой таблице массив номер пять равен 24,2, а предсказанное число — 25,4. Прогноз по-прежнему верен, и вы можете видеть, что модель работает хорошо.

    11. Найдите ошибку

    Переменная «a» — это предсказанное значение, а «y» — тестовое значение. Это дает вам ошибку. Если вы возведете это значение в квадрат, вы получите среднеквадратичную ошибку.

    Нажмите Shift+Enter, чтобы открыть значение.На этом рисунке значение среднеквадратичной ошибки равно 25,4.

    На данный момент вы успешно создали модель линейной регрессии. Значение ошибки, которое вы получаете в прогнозах, можно улучшить, если манипулировать данными. Чем меньше среднеквадратическая ошибка, тем более точные прогнозы вы получите.

    После завершения этого вводного руководства по машинному обучению проверьте свое понимание концепций с помощью этой викторины по машинному обучению!

    Резюме 

    Мы надеемся, что это введение в руководство по машинному обучению было полезным, и теперь вы лучше понимаете основы машинного обучения и то, как оно влияет на нашу повседневную жизнь.Немного попрактиковавшись, вы научитесь применять контролируемые и неконтролируемые методы машинного обучения, а также методы машинного обучения с подкреплением, чтобы делать прогнозы с различными типами данных. Эти методы необходимо освоить, если вы планируете стать инженером по машинному обучению. Как кандидат, вы можете записаться на сертификационный курс Simplilearn по машинному обучению, чтобы пройти обучение у отраслевых экспертов или пройти самостоятельное обучение. Курс не только улучшит ваши теоретические знания в области машинного обучения, но также предоставит практический опыт работы в реальных отраслевых проектах в интегрированных облачных лабораториях.Свяжитесь с Simplilearn, чтобы узнать больше о вариантах обучения.

    .

    Добавить комментарий

    Ваш адрес email не будет опубликован.