Как научиться расшифровывать стали


Марки стали – расшифровка, маркировка, таблица

Любому специалисту, имеющему дело с металлом, знакомо понятие «марки стали». Расшифровка маркировки стальных сплавов дает возможность получить представление об их химическом составе и физических характеристиках. Разобраться в данной маркировке, несмотря на ее кажущуюся сложность, достаточно просто – важно только знать, по какому принципу она составляется.

Редкое производство обходится без стали, поэтому разбираться в его марках крайне важно

Обозначают сплав буквами и цифрами, по которым можно точно определить, какие химические элементы в нем содержатся и в каком количестве. Зная это, а также то, как каждый из таких элементов может влиять на готовый сплав, можно с высокой степенью вероятности определить, какие именно технические характеристики свойственны определенной марке стали.

Виды сталей и особенности их маркировки

Сталь представляет собой сплав железа с углеродом, при этом содержание последнего в ней составляет не более 2,14%. Углерод придает сплаву твердость, но при его избытке металл становится слишком хрупким.

Одним из важнейших параметров, по которому стали делят на различные классы, является химический состав. Среди сталей по данному критерию выделяют легированные и углеродистые, последние подразделяются на мало- (углерода до 0,25%), средне- (0,25–0,6%) и высокоуглеродистые (в них содержится больше 0,6% углерода).

Разновидности сталей

Включая в состав стали легирующие элементы, ей можно придать требуемые характеристики. Именно таким образом, комбинируя вид и количественное содержание добавок, получают марки, обладающие улучшенными механическими свойствами, коррозионной устойчивостью, магнитными и электрическими характеристиками. Конечно, улучшать характеристики сталей можно и при помощи термообработки, но легирующие добавки позволяют делать это более эффективно.

По количественному составу легирующих элементов различают низко-, средне- и высоколегированные сплавы. В первых легирующих элементов не более 2,5%, в среднелегированных – 2,5–10%, в высоколегированных – более 10%.

Классификация сталей осуществляется и по их назначению. Так, выделяют инструментальные и конструкционные виды, марки, отличающиеся особыми физическими свойствами. Инструментальные виды используются для производства штамповых, мерительных, а также режущих инструментов, конструкционные – для выпуска продукции, применяемой в строительстве и сфере машиностроения. Из сплавов, отличающихся особыми физическими свойствами (также называемых прецизионными), изготавливают изделия, которые должны обладать особыми характеристиками (магнитными, прочностными и др.).

Классификация сталей по назначению

Стали противопоставляются друг другу и по особым химическим свойствам. К сплавам данной группы относятся нержавеющие, окалиностойкие, жаропрочные и др. Что характерно, нержавеющие стали могут быть коррозионностойкими и нержавеющими пищевыми – это разные категории.

Кроме полезных элементов, сталь включает и вредные примеси, к основным из которых относятся сера и фосфор. В ней также находятся газы в несвязанном состоянии (кислород и азот), что негативно отражается на ее характеристиках.

Если рассматривать основные вредные примеси, то фосфор увеличивает хрупкость сплава, особенно сильно проявляющуюся при низких температурах (так называемая хладноломкость), а сера вызывает появление трещин в металле, нагретом до высокой температуры (красноломкость). Фосфор, ко всему прочему, значительно уменьшает пластичность нагретого металла. По количественному содержанию этих двух элементов выделяют стали обыкновенного качества (не более 0,06–0,07% серы и фосфора), качественные (до 0,035%), высококачественные (до 0,025%) и особовысококачественные (сера – до 0,015%, фосфор – до 0,02%).

Маркировка сталей также указывает на то, в какой степени из их состава удален кислород. По уровню раскисления выделяют стали:

  • спокойного типа, обозначаемые буквосочетанием «СП»;
  • полуспокойные – «ПС»;
  • кипящие – «КП».

О чем говорит маркировка сталей

Расшифровать марку стали довольно просто, необходимо только владеть определенными сведениями. Конструкционные стали, обладающие обыкновенным качеством и не содержащие легирующих элементов, маркируют буквосочетанием «Ст». По цифре, идущей после букв в названии марки, можно определить, сколько в таком сплаве углерода (исчисляется в десятых долях процента). За цифрами могут идти буквы «КП»: по ним становится ясно, что данный сплав не до конца прошел процесс раскисления в печи, соответственно, он относится к категории кипящего. Если название марки не содержит таких букв, то сталь соответствует категории спокойной.

Химический состав углеродистых конструкционных сталей обыкновенного качества

Конструкционная нелегированная сталь, относящаяся к категории качественных, имеет в своем обозначении две цифры, по ним определяют среднее содержание в ней углерода (исчисляется в сотых долях процента).

Прежде чем приступить к рассмотрению марок тех сталей, которые включают легирующие добавки, следует разобраться в том, как данные добавки обозначаются. Маркировка легированных сталей может включать такие буквенные обозначения:

Список используемых легирующих добавок

Обозначение сталей с легирующими элементами

Как сказано выше, классификация сталей с легирующими элементами включает несколько категорий. Маркировка легированных сталей составляется по определенным правилам, знание которых позволяет достаточно просто определить категорию конкретного сплава и основную область его применения. В начальной части названий таких марок находятся цифры (две или одна), показывающие содержание углерода. Две цифры указывают на его среднее содержание в сплаве в сотых долях процента, а одна – в десятых. Есть и стали, не имеющие в начале названия марки цифр. Это означает, что углерод в этих сплавах содержится в пределах 1%.

Пример маркировки легированной стали

Буквы, которые можно увидеть за первыми цифрами названия марки, указывают на то, из чего состоит данный сплав. За буквами, дающими информацию о том или ином элементе в его составе, могут стоять или не стоять цифры. Если цифра есть, то по ней определяется (в целых процентах) среднее содержание указанного буквой элемента в составе сплава, а если цифры нет, значит, данный элемент содержится в пределах от 1 до 1,5%.

В конце маркировки отдельных видов сталей может стоять буква «А». Это говорит о том, что перед нами высококачественная сталь. К таким маркам могут относиться и углеродистые стали, и сплавы с легирующими добавками в своем составе. Согласно классификации, к данной категории сталей причисляются те, в которых сера и фосфор составляют не более 0,03%.

Примеры маркировки сталей различных видов

Определение марки стали и причисление сплава к определенному виду – это задача, которая не должна вызывать никаких проблем у специалиста. Не всегда под рукой есть таблица, в которой дается расшифровка названий марок, но разобраться с этим помогут примеры, которые приведены ниже.

Содержание элементов в распространенных марках стали (нажмите для увеличения)

Конструкционные стали, не содержащие легирующих элементов, обозначаются буквосочетанием «Ст». Цифры, стоящие следом, – это содержание углерода, исчисляемое в сотых долях процента. Несколько иначе маркируются низколегированные конструкционные стали. К примеру, в стали марки 09Г2С 0,09% углерода, а легирующие добавки (марганец, кремний и др.) содержатся в ней в пределах 2,5%. Очень похожие по своей маркировке 10ХСНД и 15ХСНД отличаются разным количеством углерода, а доля каждого легирующего элемента в них составляет не больше 1%. Именно поэтому после букв, обозначающих каждый легирующий элемент в таком сплаве, не стоит никаких цифр.

20Х, 30Х, 40Х и др. – так маркируются конструкционные легированные стали, преобладающим легирующим элементом в них является хром. Цифра в начале такой марки – это содержание углерода в рассматриваемом сплаве, исчисляемое в сотых долях процента. За буквенным обозначением каждого легирующего элемента может быть проставлена цифра, по которой и определяют его количественное содержание в сплаве. Если ее нет, то указанного элемента в стали содержится не больше 1,5%.

Можно рассмотреть пример обозначения хромокремнемарганцевой стали 30ХГСА. Она, согласно маркировке, состоит из углерода (0,3%), марганца, кремния, а также хрома. Каждого из данных элементов в ней содержится в границах 0,8–1,1%.

Как расшифровать маркировку сталей?

Чтобы расшифровка обозначения различных видов сталей не вызывала затруднений, следует хорошо знать, какими они бывают. Отдельные категории сталей имеют особенную маркировку. Их принято обозначать определенными буквами, что позволяет сразу понять и назначение рассматриваемого металла, и его ориентировочный состав. Рассмотрим некоторые из таких марок и разберемся в их обозначении.

Свойства и назначение конструкционных легированных сталей

Конструкционные стали, специально предназначенные для изготовления подшипников, можно узнать по букве «Ш», данная литера ставится в самом начале их маркировки. После нее в названии марки идет буквенное обозначение соответствующих легирующих добавок, а также цифры, по которым узнают количественное содержание этих добавок. Так, в сталях марок ШХ4 и ШХ15, кроме железа с углеродом, содержится хром в количестве 0,4 и 1,5%, соответственно.

Буквой «К», которая стоит после первых цифр в названии марки, сообщающих о количественном содержании углерода, обозначают конструкционные нелегированные стали, используемые для производства сосудов и паровых котлов, работающих под высоким давлением (20К, 22К и др.).

Качественные легированные стали, которые обладают улучшенными литейными свойствами, можно узнать по букве «Л», стоящей в самом конце маркировки (35ХМЛ, 40ХЛ и др.).

Некоторую сложность, если не знать особенностей маркировки, может вызвать расшифровка марок строительной стали. Сплавы данной категории обозначают буквой «С», которую ставят в самом начале. Цифры, следующие за ней, указывают на минимальный предел текучести. В таких марках также используются дополнительные буквенные обозначения:

  • литера Т – термоупрочненный прокат;
  • буква К – сталь, отличающаяся повышенной коррозионной устойчивостью;
  • литера Д – сплав, характеризующийся повышенным содержанием меди (С345Т, С390К и др.).

Нелегированные стали, относящиеся к категории инструментальных, обозначают буквой «У», она проставляется в начале их маркировки. Цифра, идущая за данной буквой, выражает количественное содержание углерода в рассматриваемом сплаве. Стали данной категории могут быть качественными и высококачественными (их можно определить по букве «А», она проставляется в конце названия марки). В их маркировке может содержаться буква «Г», что означает повышенное содержание марганца (У7, У8, У8А, У8ГА и др.).

Инструментальные стали, содержащие легирующие элементы в своем составе, маркируются аналогично с легированными конструкционными (ХВГ, 9ХВГ и др.).

Состав легированных инструментальных сталей (%)

Маркировка тех сталей, которые входят в категорию быстрорежущих, начинается с буквы «Р», за которой идут цифры, указывающие на количественное содержание вольфрама. В остальном марки таких сплавов называются по стандартному принципу: буквы, обозначающие элемент, и, соответственно, цифры, отражающие его количественное содержание. В обозначении таких сталей не указывается хром, так как его стандартное содержание в них составляет около 4%, а также углерод, количество которого пропорционально содержанию ванадия. Если количество ванадия превышает 2,5%, то его буквенное обозначение и количественное содержание проставляют в самом конце маркировки (З9, Р18, Р6М5Ф3 и др.).

Влияние некоторых добавок на свойства стали

По-особому маркируются нелегированные стали, относящиеся к категории электротехнических (их еще часто называют чистым техническим железом). Невысокое электрическое сопротивление таких металлов обеспечивается за счет того, что их состав характеризуется минимальным содержанием углерода – менее 0,04%. В обозначении марок таких сталей нет букв, только цифры: 10880, 20880 и др. Первая цифра указывает на классификацию по типу обработки: горячекатаная или кованная – 1, калиброванная – 2. Вторая цифра связана с категорией коэффициента старения: 0 – ненормируемый, 1 – нормируемый. Третья цифра указывает на группу, к которой данная сталь относится по нормируемой характеристике, принятой за основную. По четвертой и пятой цифрам определяется само значение нормируемой характеристики.

Принципы, по которым осуществляется обозначение стальных сплавов, были разработаны еще в советский период, но и по сей день успешно используются не только в России, но также в странах СНГ. Обладая сведениями о той или иной марке стали, можно не только определять ее химический состав, но и эффективно подбирать металлы с требуемыми характеристиками.

Разбираться в данном вопросе важно как специалистам, разрабатывающим и проектирующим различные конструкции из металла, так и тем, кто часто работает с различными сталями и занимается изготовлением из них деталей разного назначения.

Оценка статьи:

Загрузка...

Поделиться с друзьями:

Криптография 101: Основные методы решения для подстановочных шифров

  1. Игры
  2. Криптограммы
  3. Криптография 101: Основные методы решения для подстановочных шифров

Дениз Сазерленд, Марк Колтко-Риверак 13 для криптограмм

для криптограмм

Шпаргалка для манекенов

Неважно, представляет ли вам криптограмма буквы, числа, загадочные символы, линии и точки или странные волнистые линии пришельцев - если вас попросят заменить каждую букву в алфавите на другой символ, вы ' мы имеем дело с простым шифром подстановки.

Все подстановочные шифры можно взломать с помощью следующих советов:

  • Просканируйте шифр в поисках однобуквенных слов. Это почти определенно A или I.

  • Подсчитайте, сколько раз каждый символ появляется в головоломке. Наиболее частым символом, вероятно, является E. Это также может быть T, A, или O, , особенно если криптограмма довольно короткая.

  • Карандаш в ваших догадках над зашифрованным текстом. Типичные фрагменты слова начинают проявляться? Будьте готовы стереть и изменить свои догадки!

  • Ищите апострофы. За ними обычно следуют S, T, D, M, LL, или RE.

  • Ищите повторяющиеся буквы. Это могут быть общие группы букв, например TH, SH, RE, CH, TR, ING, ION, и ENT.

  • Попробуйте расшифровать двух-, трех- и четырехбуквенные слова.

    • Двухбуквенные слова почти всегда имеют одну гласную и одну согласную. Пять наиболее распространенных двухбуквенных слов в порядке частоты: OF, TO, IN, IS, и IT.

    • Наиболее распространенные трехбуквенные слова в порядке частоты: THE, AND, FOR, WAS, и HIS.

    • Самым распространенным четырехбуквенным словом является ТО. Зашифрованное слово с шаблоном 1 - - 1 скорее всего будет THAT. Однако образец 1 - - 1 также представляет 30 других слов, так что имейте это в виду!

  • Сканирование двойных букв. Скорее всего, это будут LL, , за которыми по частоте следуют EE, SS, OO, и TT (и далее до менее часто встречающихся двойников).

Об авторе книги
Дениз Сазерленд - синдицированный автор головоломки.Ее головоломки появляются в ряде публикаций, в том числе в серии Reader's Digest Mind Stretchers , а также она является автором книги Word Searches For Dummies .

Марк Э. Кольтко-Ривера , доктор философии, масон 32 степени и эксперт по основным символам и церемониям масонства. Используя этот опыт, он проанализировал предпубликационные улики, чтобы раскрыть и написать в блоге о ключевых элементах The Lost Symbol. Он является одним из ведущих еженедельного подкаста Masonic Central.

.

8 древних систем письма, которые еще не были расшифрованы

Может быть шокирующим осознавать, что мы можем следовать правилам грамматики, которым нас никто никогда не учил. Но это то, что составляет большую часть языка - не мелочи, которые учебники говорят нам, что мы ошибаемся, а твердые вещи, которые мы всегда делаем правильно. Однако люди, не являющиеся носителями языка, могут ошибаться, и это дает нам хорошую возможность взглянуть на правила, которые мы иначе не замечаем.

1. Почему это «Великие зеленые драконы», а не «Великие зеленые драконы»

В 2016 году Мэтью Андерсон из BBC написал в Твиттере правило, что «англоговорящие люди знают, но не знают, что знаем мы.Это был снимок экрана отрывка из книги Марка Форсайта «Элементы красноречия », в котором объясняется, что причина того, что «большие зеленые драконы» звучат лучше, чем «зеленые великие драконы», заключается в том, что мы бессознательно следуем правилу, согласно которому порядок прилагательных в Английский язык - мнение-размер-возраст-форма-цвет-происхождение-материал-цель. Размер важнее цвета, поэтому никаких «зеленых великих драконов».

2. Почему мы говорим «Автомобиль моего брата», а не «Автомобиль моего брата»

Есть два основных способа выразить владение на английском языке: один с пометкой «владение» на владельце (машина моего брата) и второй с помощью фразы «из» (машина моего брата).Учителя и руководства по использованию обычно не содержат правил, объясняющих, почему «машина моего брата» звучит плохо, но «дверь моего дома» звучит хорошо, потому что никто не думает сразу сказать «машина моего брата» . Но почему нет? В конце концов, такие конструкции, как испанский и французский, используют такую ​​конструкцию ( el coche de mi hermano , la voiture de mon frère ). Почему «машина моего брата» звучит намного лучше, чем «машина моего брата», а «дверь моего дома» звучит так же или хуже, чем «дверь моего дома»?

Мы этого не знаем, но мы делаем эти фразы со ссылкой на нечто, называемое иерархией анимации.Иерархия в этом случае - это, по сути, шкала в порядке убывания человечности, переходящая от человека к животному и неодушевленным объектам. Чем выше анимация у обладателя, тем хуже звучит конструкция типа «из». Итак,

«машина моего брата» звучит лучше, чем «машина моего брата»

«Клетка моего попугая» звучит немного лучше, чем «Клетка моего попугая»

«дверь моего дома» звучит так же или хуже, чем «дверь моего дома»

Конечно, есть такие соображения, как разговорный контекст и риторический эффект, которые приводят к исключениям из этого правила, но они действительно объясняют большую разницу в относительной приемлемости этих двух синтаксических вариантов.Например, «мэрию» можно представить как неодушевленное здание («ступеньки ратуши») или как собрание людей («объявление мэрии»).

3. Почему это «Абсолютно-Чудо-Лютли», а не «Абсолютно-Чудесно»

Есть способ выделить слово в английском языке, который включает в себя вставку ругательства в середине слова, а не где-нибудь в середине. В то время как безумно безумно звучит правильно, безумно безумно и безумно безумно звучат ужасно.Здесь действует правило, связанное со слоговой структурой слова. По сути, вы находите слог с наибольшим ударением внутри слова и ставите перед ним нецензурное слово. Kalama-freakin’-ZOO . Im-bloody-PORtant , la-freakin’-SAgna .

Все усложняется, когда ударение делается только на первом слоге ( YESter-freakin'-day ? ELE-bloody-phant? ) или когда в слове есть другие, более разделимые границы, такие как un- или re- ( un-freakin'-beLIEVable and re-freakin-poSSESSED , лучше, чем unbe-freakin'-LIEVable and repo-freakin'-SSESSED ), но эти исключения могут быть категоризированы и объяснены.Важно то, что есть правило, и мы уже знаем, как его применять, даже если не можем его сформулировать.

4. Почему мы говорим: «Что ты сказал, что он ел?» а не «Что ты пробормотал, что он ел?»

По-английски, когда мы задаем вопрос «кто / что / где / когда / почему», обычно в предложении есть место, куда подходил бы ответ, если бы это не был вопрос. На вопрос «Что ты ел?» соответствующее предложение: «Я съел __ [картошка / яблоко / мой завтрак…]». Для "Куда они делись?" соответствующее предложение гласит: «Они пошли __ [на пляж / на обед / вниз…].”

Лингвисты говорят об этих типах вопросов с точки зрения движения; это как если бы слово «wh» переместилось из места предложения без вопросов в начало предложения. Wh-движение также может происходить вне фраз, находящихся далеко от начала предложения. «Что вы сказали, что напомнило вам начало фильма?» соответствует «Вы сказали, что начало фильма напомнило вам __ [движущийся день / прогноз погоды / Древняя Греция…]».

Но есть много случаев, когда вы не можете выполнять такие движения.Например, для этих сложных, длинных падежей главный глагол предложения должен принадлежать к определенному классу глаголов, которые лингвисты называют мостовыми глаголами. Скажем, - это глагол моста («Что ты сказал, что он ел _____?»), Но глаголы, которые включают манеру, в которой что-то было сказано ( бормотание , крик , шепот , рыдание ) не . Итак, «Что ты пробормотал, что он ел ___?» звучит ужасно. Мы не составляем таких предложений, потому что знаем правило, даже если мы не знаем, что правило существует.

5. Почему это «Я развеселил свою подругу», а не «Я развеселил ее»

В английском языке есть группа глаголов, известных как фразовые глаголы, которые вызывают у изучающих язык серьезную головную боль. Это глаголы, состоящие из нескольких слов, которые вместе дают другое значение, чем вы могли бы ожидать от простого сочетания. Например, взорвать - это фразовый глагол, потому что он означает «взорвать», а не «дуть вверх». Вам просто нужно понять, что они означают. Это такие глаголы, как отменить (отменить), перейти к (пересмотреть) и отложить (оскорбление).Их сотни.

Не все фразовые глаголы работают по одним и тем же правилам. Некоторые не позволяют помещать объект между частями глагола: вы можете сказать: «Не выбирайте вашу сестру», но не « не выбирайте вашу сестру на ». Но другие фразовые глаголы можно разделить: вы можете сказать: «Давайте отменим встречу» или «Давайте позвоним на на встречу от ». Носители языка знают, какие из них отделимы, а какие нет, даже не заглянув в свод правил.Носители языка должны понять разницу на собственном опыте.

Но это еще не все. Даже отдельные глаголы имеют ограничение, о котором носители языка никогда не узнают. Поднимите настроение можно отделить. Вы можете сказать: «Я подбодрил , мой друг, поднял » или «Я подбодрил , мой друг». Но если вы хотите заменить my friend местоимением, между частями глагола нужно поставить . Нельзя сказать «Я подбодрил ее » только «Я подбодрил ее » .Для неразделимых глаголов местоимения не проблема: « не выбирайте ее».

В остальной части английской грамматики вы можете заменить местоимение везде, где есть существительная фраза. Не в этом дело. Но вы это уже знали, даже если не знали, что знали это.

.

Как расшифровать формулы ионных соединений

  1. Образование
  2. Наука
  3. Химия
  4. Как расшифровать формулы ионных соединений

Когда образуется ионное соединение, катион и анион притягиваются друг к другу, в результате чего в соли. Важно помнить, что соединение должно быть нейтральным - иметь равное количество положительных и отрицательных зарядов.

Соединение магния и брома

Предположим, вы хотите узнать формулу или состав соединения, которое образуется в результате реакции магния с бромом.Вы начинаете с того, что кладете два атома рядом, металл - слева, а затем складываете их заряды. На следующем рисунке показан этот процесс.

Расчет формулы бромида магния.

Электронные конфигурации для магния и брома:


Магний, щелочноземельный металл, имеет два валентных электрона, которые он теряет, образуя катион с зарядом 2+. Электронная конфигурация катиона магния:

Бром, галоген, имеет семь валентных электронов, поэтому он получает один для завершения своего октета (восемь валентных электронов) и образования бромид-аниона с зарядом 1.Электронная конфигурация бромид-аниона

Состав должен быть нейтральным; он должен иметь одинаковое количество положительных и отрицательных зарядов, чтобы в целом он имел нулевой заряд. Ион магния имеет 2+, поэтому ему требуются 2 аниона бромида, каждый с одним отрицательным зарядом, чтобы сбалансировать 2 положительных заряда магния. Итак, формула соединения, полученного в результате реакции магния с бромом, следующая:

Использование правила перекрещивания

Существует быстрый способ определить формулу ионного соединения: использовать крестообразное правило .

Посмотрите на предыдущий рисунок, чтобы увидеть пример использования этого правила:

  1. Возьмите числовое значение верхнего индекса иона металла (забудьте о символе заряда) и переместите его в нижнюю правую часть символа неметалла в качестве нижнего индекса.

  2. Затем возьмите числовое значение верхнего индекса неметалла и сделайте его индексом металла.

    Обратите внимание, что если числовое значение равно 1, оно просто понимается и не отображается.

Итак, в этом примере вы превращаете магний 2 в индекс брома, а бром 1 - в индекс магния (но поскольку это 1, вы не показываете его), и вы получаете формулу:

Что произойдет, если вы прореагируете с алюминием и кислородом? На рисунке ниже показано правило перекрещивания, используемое для этой реакции.

Расчет формулы оксида алюминия.

Точно так же работают соединения, содержащие многоатомные ионы. Например, вот соединение, состоящее из катиона аммония и аниона сульфида:

Обратите внимание, что, поскольку для нейтрализации двух отрицательных зарядов сульфид-иона необходимы два иона аммония (два положительных заряда), ион аммония заключен в скобки и добавлен нижний индекс 2.

Правило перекрещивания работает очень хорошо, но есть ситуация, когда нужно быть осторожным.Предположим, вы хотите записать соединение, образующееся при реакции магния с кислородом. Магний, щелочноземельный металл, образует катион 2+, а кислород образует анион 2-. Таким образом, вы можете предположить, что формула:

Но эта формула неверна. После того, как вы воспользуетесь правилом крест-накрест, вам нужно уменьшить все индексы на общий коэффициент, если это возможно. В этом случае вы разделите каждый индекс на 2 и получите правильную формулу:

MgO

.

Как глубокое обучение расшифровывает исторические документы

Исследователи глубокого обучения добиваются успеха.

Создавая инструменты искусственного интеллекта для буквенного преобразования исторических текстов в устаревшие шрифты, они создают бесценный ресурс для исследователей, изучающих документы многовековой давности.

Многие старые документы были оцифрованы как отсканированные изображения или фотографии физических страниц. Но хотя устаревшие шрифты, такие как греческий miniscule или немецкий Fraktur, могут быть прочитаны экспертами, текст на этих отсканированных страницах не читается широкой аудиторией и не доступен для поиска с помощью компьютеров.

Наем переводчиков для преобразования рукописей в печатный текст - длительный и дорогостоящий процесс. Поэтому разработчики создали цифровые инструменты для оптического распознавания символов, процесса преобразования печатных или письменных символов в машиночитаемую форму.

А глубокое обучение резко повышает точность этих инструментов.

Гуманитарные исследователи могут использовать эти тексты, проанализированные искусственным интеллектом, для поиска определенных слов в книге, наблюдения за тем, как популярное повествование менялось с течением времени, анализа эволюции языка или отслеживания происхождения человека с помощью переписей и деловых записей.

Еще одно преимущество этого исследования: изображения текста являются идеальным полигоном для тестирования сетей глубокого обучения распознаванию объектов. Это потому, что, в отличие от идентификации изображений животных или различных элементов на уличных сценах, есть только один правильный ответ при определении того, читается ли напечатанная буква «с» или «о».

«Если вы наведете свою модель глубокого обучения на фотографию собаки, неясно, какой будет правильный ответ», - сказал исследователь NVIDIA Томас Бруэл. «Это может быть« собака »,« животное »или« короткошерстный корги ».«Для печатных текстов это предельно ясно - мы знаем, когда это правильно, а когда нет».

На одной странице

Бруэль использует глубокое обучение для анализа исторических текстов с 2004 года и возглавил первую исследовательскую группу, которая сделала это с LSTM, своего рода повторяющейся нейронной сетью.

«Это был настоящий прорыв с точки зрения показателей распознавания и количества ошибок», - сказал Бруэль, который в то время был профессором Кайзерслаутернского университета в Германии.

Германия, родина печатного станка Гутенберга, была естественным местом для изучения исторических данных, говорит Бруэль. Изобретение привело к распространению печатных машин по Европе в эпоху Возрождения.

Fraktur был широко используемым шрифтом с 16 по начало 20 веков в Германии и странах, находящихся под немецким влиянием, как видно на этой странице из датской сказки Ганса Христиана Андерсена «Свинопас», напечатанной в 1885 году (Изображение с Wikimedia Commons, лицензировано находится в общественном достоянии)

Многие немецкие печатные тексты XVI - начала XX веков написаны художественным шрифтом Fraktur (изображен справа).«Это сценарий, который люди больше не могут читать», - сказал Бруэл.

Его команда разработала в 2007 году систему с открытым исходным кодом под названием OCRopus («OCR» для оптического распознавания символов) для цифровой расшифровки текстов Fraktur.

Последняя версия программного обеспечения Бруэля, ocropus3, доступна на GitHub. Коэффициент ошибок для латинских шрифтов составляет всего 0,1 процента. Используя обучающие данные для других языков и сценариев, исследователи использовали OCRopus для латинских, греческих и санскритских текстов.

Для другого немецкого исследователя, Уве Спрингманна, открытие OCRopus изменило его цифровые гуманитарные исследования.Уровень распознавания символов латинских и немецких печатных изданий 15-18 веков, с которыми он работал, подскочил с 85 до 98 процентов.

«Это не просто постепенный прогресс», - сказал он. «Это был огромный шаг вперед».

Спрингманн и его частый соавтор Кристиан Реул теперь работают с графическими процессорами NVIDIA и механизмом распознавания текста с открытым исходным кодом Calamari, который объединяет LSTM и сверточные нейронные сети.

Использование графических процессоров привело к 10-кратному ускорению обучения и вывода, говорит Ройл, исполняющий обязанности директора подразделения оцифровки в Центре филологии и цифровых технологий Университета Вюрцбурга.

Печатная страница

Несколько лет назад историки оцифровали миллионы страниц как отсканированные изображения, «но расшифровать все было просто невозможно», - сказал Маркус Ливицки, профессор машинного обучения в технологическом университете Швеции в Лулео.

Благодаря инструментам распознавания текста на основе глубокого обучения ученый, интересующийся конкретным политическим деятелем, теперь может запрашивать машиночитаемые версии исторических текстов и находить каждое упоминание этого человека.

Это изображение поединка обезьян является маргиналией из рукописи начала XIV века, объединяющей Псалтирь и Часовую книгу.(Фотография с сайта Flickr, лицензия является общественным достоянием)

Но многие документы содержат больше, чем напечатанные слова - например, изображения, маргинализацию или водяные знаки. Ливицки создает инструменты глубокого обучения для анализа этих особенностей исторических текстов.

«Графические процессоры преобразовали весь процесс цифровых гуманитарных исследований», - говорит он.

Его проект под названием HisDoc использует нейронные сети для определения высокоуровневых характеристик документа, таких как период публикации и используемый шрифт, а также анализирует отдельные страницы для определения того, какие области содержат текст, а какие - изображения.

Используя кластер графических процессоров NVIDIA, Ливицки обучил нейронную сеть на базе данных из 80 000 водяных знаков. Ученые заинтересованы в документах с соответствующими водяными знаками, потому что они намекают, что тексты были созданы в одном регионе и в один и тот же период времени.

Не только печатные документы

Исторические записи были созданы не только на печатных станках - многие произведения, представляющие интерес для ученых, были созданы вручную. Это затрудняет их чтение с помощью машины, потому что писатели часто используют сокращения, почерк человека меняется на странице, а написанные от руки слова могут не совпадать с идеальными горизонтальными линиями, как печатный текст.

Здесь нейронные сети также используются как эффективный инструмент транскрипции.

Паоло Мериалдо, Донателла Фирмани и Елена Ниедду, исследователи из итальянского университета Рома Тре, используют глубокое обучение для расшифровки папской корреспонденции XII века из Секретного архива Ватикана, крупнейшего исторического архива в мире.

Используя графический процессор NVIDIA Quadro и сверточные нейронные сети, они разработали систему, которая распознает рукописные символы с точностью 96 процентов и определяет наиболее вероятную транскрипцию для каждого слова на основе модели латинского языка.

Студенты-исследователи Киевского политехнического института имени Игоря Сикорского делают шаг вперед, разрабатывая нейронную сеть для интерпретации средневековых граффити, вырезанных на каменных стенах Софийского собора в Киеве.

Ученые обсуждают интерпретацию некоторых надписей, сказал соавтор статьи Юрий Гордиенко. Модель глубокого обучения, созданная на базе графических процессоров NVIDIA, позволила добиться 99-процентной точности распознавания отдельных символов.

Анализ документов - это активная область исследований, работа которой представлена ​​на специализированных конференциях, а также на крупных собраниях по компьютерному зрению и машинному обучению, таких как CVPR и NeurIPS.

.

Смотрите также