Гражданство по носителю русского языка форум: общие вопросы — Бесплатные консультации на форуме

Содержание

ВНИМАНИЮ ИНОСТРАННЫХ ГРАЖДАН, ЖЕЛАЮЩИХ ПРИОБРЕСТИ ГРАЖДАНСТВО РОССИИ НА ОСНОВАНИИ ПРИЗНАНИЯ НОСИТЕЛЕМ РУССКОГО ЯЗЫКА

В связи с последними изменениями в законодательстве России о гражданстве Генконсульство информирует о следующем.

В соответствии с Федеральным законом Российской Федерации от 20 апреля 2014 г. № 71-ФЗ «О внесении изменений в Федеральный закон «О гражданстве Российской Федерации» и отдельные законодательные акты Российской Федерации» устанавливается упрощённый порядок приёма в гражданство Российской Федерации иностранных граждан и лиц без гражданства, проживающих на территории Российской Федерации и признанных носителями русского языка.

Иностранные граждане могут быть признаны носителями русского языка, то есть теми, кто владеет русским языком и повседневно используют его в семейно-бытовой и культурной сферах, если эти лица или их родственники по прямой восходящей линии постоянно проживают или ранее постоянно проживали на территории Российской Федерации либо на территории, относившейся к Российской империи или СССР, в пределах Государственной границы Российской Федерации.

Федеральным законом устанавливается порядок признания иностранного гражданина или лица без гражданства носителем русского языка, предусматривающий собеседование, которое проводится с ним комиссией по признанию иностранного гражданина или лица без гражданства носителем русского языка. Комиссии образуются ФМС России и его территориальными органами.

Иностранные граждане, признанным носителями русского языка, приобретают гражданство Российской Федерации без соблюдения требований, касающихся срока проживания на территории Российской Федерации, при условии отказа иностранных граждан от имеющегося у них гражданства иностранного государства. Отказ от гражданства иностранного государства не требуется, если это предусмотрено международным договором Российской Федерации либо если отказ от гражданства иностранного государства невозможен в силу независящих от лица причин.

Для получения гражданства соискатель:

  1. Обращается в комиссию ФМС России с заявлением о признании его носителем русского языка.
  2. Получает решение комиссии о признании носителем русского языка.

В целях оформления гражданства:

  1. Обращается в ФМС России с заявлением о выдаче уведомления о возможности приема в гражданство Российской Федерации и о выдаче вида на жительство сроком на 3 года. Уведомление выдается в срок до 3 месяцев, вид на жительство – до 6 месяцев.
  2. В течение двух лет с момента получения вида на жительство подает заявление о приеме в гражданство Российской Федерации с одновременным предоставлением документа, подтверждающего выход из гражданства иностранного государства. Заявление рассматривается в течение 3 месяцев.

Ознакомиться с полной редакцией федерального закона можно на сайте «Российской газеты» http://www.rg.ru/2014/04/23/grazhdanstvo-dok.html 

Отзывы наших клиентов

Коротецкая Ирина

Благодарна за содействие в получении вида на жительство.

Берегич Анна

Выражаю благодарность юристам ЕМС за помощь по отмене решения о выдворении.

Джамиев А.

Спасибо ЕМС за помощь в получении Вида на жительство в РФ.

Сардарян Р.

Выражаю благодарность ЕМС за помощь в оформлении вида на жительство.

Чехерия С

Огромное спасибо за помощь в установлении личности.

 

Катюжанская М

Выражаю благодарность за помощь в оформлении рвп.

 

Божко Ирина

Выражаю благодарность ЕМС за помощь в оформлении вида на жительство.

Наш клиент

Благодарю юристов ЕМС за помощь в восстановлении Российского гражданства.

Буграменко В.С

Выражаю благодарность ЕМС за помощь в оформлении статуса носителя русского языка! 

Холматов С.

Спасибо ЕМС за помощь по снятию ошибочного запрета на въезд.

Али Зайд Салех Салем

Выражаю благодарность ЕМС за правовую помощь в оформление разрешения на временное проживание.

Саимова М.

 

Благодарю юристов ЕМС за помощь в открытие вьезда в РФ и воссоединение моей семьи.

Юлдашев М.

Выражаю благодарность за решение моего вопроса по открытию вьезда в Российскую Федерацию.

 

Арифходжаев Жахонгир

Благодарю ЕМС за помощь в оформлении разрешения на работу!

О. Кузьмин

Спасибо ЕМС за помощь в получении Вида на жительство в РФ.

Живаго Антон

Спасибо юристам ЕМС!

Бабицкий В.

Благодарю за помощь в оформлении разрешения на работу.

Волошина Ю.

Выражаю огромную признательность за правовое содействие в вопросе оформления статуса временное убежище!

Левин Юрий

Благодарю специалистов ЕМС за высококвалифицированную правовую помощь в получении статуса временное убежище!

Гулька Николай

 

Благодарю за юридическую помощь в открытие вьезда в РФ.

Тургунов Улугбек

Выражаю благодарность за помощь в оформлении уведомления о признании меня носителем русского языка! 

Гражданка Украины — Климик Татьяна

Выражаю благодарность за правовую поддержку в вопросе снятия ограничения вьезда!

Савин А.

Благодарю юристов Единой миграционной службы за помощь в открытие въезда на территорию Российской Федерации моему другу!

Гр. Палестины Абулехия

Выражаю благодарность Единой миграционной службе за помощь в оформлении ВНЖ.

Александр Шепс и Мэрилин Керро в гостях у Единой миграционной службы

Благодарим за помощь.

Кононов Генадий

Выражаю благодарность единой миграционной службе за помощь в оформлении Вида на жительство в РФ.

Живков В.

С.

Оказана правовая помощь в решении вопроса с открытием въезда на территорию Российской Федерации. Благодарим за помощь.

 

Экзамен по признанию НРЯ | Официальный консультант ММЦ

Чтобы получить официально российское гражданство необходимо успешно сдать экзамен на знание отечественного языка. Этот статус даст возможность упрощенно и быстро получить гражданство. Подходит вариант как для иностранцев, так и для людей без гражданства. В статье 33.1 ФЗ «О гражданстве Российской Федерации» написано о том, что существует специальный порядок проведения НРЯ. Каждый потенциальный гражданин страны должен пройти комиссию, чтобы официально получить свой статус. Для того чтобы присоединиться к этой процедуре, необходимо подать заявку и пакет документов в ближайшее отделение МВД. После остается лишь дожидаться одобрения и готовиться к тесту. Как правило, на этом этапе у людей возникают вопросы, поскольку многие боятся, что они не смогут сдать НРЯ и подтвердить свои знания.

Что делать? Рекомендуется сразу обращаться за помощью к опытным юристам. Они не только помогут собрать документы, но и расскажут про структуру НРЯ, комиссию, а также помогут его успешно сдать, чтобы получить шанс на оформление гражданства.
Как правило, день сдачи НРЯ назначается практически сразу после рассмотрения заявки на получение данного статуса. У человека остается буквально несколько дней на подготовку. Не рекомендуется брать отсрочку, согласного Закону 33.1 у человека остается в запасе не более пяти дней после официальной даты назначения экзамена. Но даже так рисковать не рекомендуется. Сейчас много желающих, которые хотят сдать экзамен на НРЯ, из-за чего была введена талонная система, так что лучше явиться на проверку в назначенное время и день. Чтобы не забыть о важных моментах и датах лучше сразу обращаться за помощью к юристам.

Кто входит в комиссию?

Приказ МВД, выпущенный еще в 2017 году под номером 738 регламентирует работу комиссии, которая принимает экзамен на знание языка.
В ее состав обязательно входят:

  • работник МВД;
  • ученый;
  • лингвист;
  • филолог.

Это может быть как один представитель определенной структуры, так и несколько из них. Обычно на НРЯ присутствуют преподаватели высших учебных заведений. В каждой комиссии есть председатель, его заместитель, секретарь и, конечно же, члены комиссии. Важно, чтобы количество людей в комиссии на знание НРЯ было нечетным. ГУВМ МВД РФ в обязательном порядке утверждает состав местной комиссии. Именно ей необходимо сдать НРЯ.

Чего ожидать от экзамена?

Нет одного установленного порядка для каждого региона. В целом экзамен на знание русского языка длится не более получаса, он проходит как устно, так и письменно. Многие утверждают, что бояться в принципе даже нечего, комиссия лояльная, добрая и все получится сдать. Но есть и другая статистика касательно НРЯ. Люди не проходят, лишаются возможности получить гражданство. Невозможно выучить русский язык в кратчайшие сроки самостоятельно. Поэтому лучше обращаться за помощью к специалистам. Причем речь идет не о репетиторе, а профессиональной юридической компании, которая знает, как будет проходить экзамен на НРЯ и что стоит ожидать от комиссии.
Также не помешает ознакомиться с отзывами о комиссии и НРЯ в интернете, изучить тематические форумы. Опыт других людей позволит морально подготовиться к экзамену. Здесь только два варианта: получилось сдать комиссии или экзамен завален.

Структура экзамена НРЯ

Проходит проверка НРЯ как обычная беседа. Человек должен отвечать на вопросы на определенную тематику или просмотреть видео и рассказать о нем. Письменная часть НРЯ состоит из изложения или теста. Стоит отметить, что в Законе Российской Федерации не прописаны какие-либо нормы или правила касательно поведения во время экзамена. Каждый регион самостоятельно устанавливает формат и часто способ проведения экзамена НРЯ зависит от членов комиссии. От комиссии зависит, получится сдать НРЯ или нет. За каждый из пройденных этапов человек получает определенный балл, все они суммируются, выводится среднее значение. Все результаты НРЯ секретарь фиксирует в протоколе.
Иностранный гражданин должен успешно пройти:

  • тестирование;
  • изложение;
  • устное собеседование.

В тестировании во время экзамена может попасться что угодно. От ответов на вопросы на НРЯ касательно прочитанного текста до расстановки пропущенных букв или знаков препинания в предложениях. В изложении человек кратко пересказывает прочитанный текст, а при устном разговоре необходимо ответить на ряд вопросов. Из этого и состоит экзамен для комиссии на НРЯ.

Что делать, если не получается сдать экзамен на знание русского языка?

Не у каждого человека получается сдать экзамен на знание русского языка. В основном проблемы возникают с тестированием или устным собеседованием с комиссией. Подготовиться к этому возможно. Профессионалы из юридической фирмы подскажут, каких вопросов стоит ожидать от комиссии. Главное отвечать без воды, не вступать в споры с комиссией. Практика показывает, что чем больше ошибок было допущено в письменной части, тем больше вопросов задают тому, кто сдает экзамен. Рекомендуется сделать акцент на тестах. Профессиональные юристы помогут справиться с трудностями касательно сдачи и сбора необходимых документов.
Часто во время экзамена НРЯ спрашивают:

  • где учился человек, кем он работал;
  • кто именно из родных проживает в России;
  • знает ли кандидат какие-то пословицы, поговорки, связанные с государством;
  • какие музеи и памятные места уже удалось посетить;
  • кто является кумиром в русской литературе.

Список потенциальных вопросов обширный, подробнее с ними ознакомит юрист. В каждом регионе Российской Федерации есть свои особенности. Если знать специфику, получится без проблем сдать экзамен на НРЯ и получить желаемый статус гражданина Российской Федерации. Если в тестах будет минимум ошибок, то на собеседовании не станут задавать «сложные» вопросы.

Фонд науки и образования — Процедура принятия гражданства будет упрощена

Предлагается упростить процедуру принятия гражданства для носителей русского языка и русской культуры

   В Комитет Государственной Думы по государственному строительству и законодательству для предварительного рассмотрения поступил проект федерального закона №69201-7 «О внесении изменений в Федеральный закон от 31 мая 2002 года № 62-ФЗ «О гражданстве Российской Федерации» и в Федеральный закон от 25 июля 2002 года №115-ФЗ «О правовом положении иностранных граждан в Российской Федерации» в отношении носителей русского языка», разработанный депутатом Константином Затулиным.

   Предлагаемые поправки, по мнению автора законодательной инициативы, приведут законодательство в соответствии с поручением Президента России от 12 декабря 2012 года об ускоренном порядке предоставления российского гражданства соотечественникам, носителям русского языка и русской культуры, прямым потомкам тех, кто родился в Российской Империи и Советском Союзе.

   Одна из поправок — в определение «носителя русского языка», данное в Законе «О гражданстве РФ» (в части 1 статьи 31.1 «Признание иностранного гражданина или лица без гражданства носителем русского языка»). Предлагается дать право пройти собеседование на комиссии по признанию иностранного гражданина или лица без гражданства носителем русского языка не только тем, кто сам или его родственники по прямой восходящей линии постоянно проживают или ранее постоянно проживали на территории Российской Федерации либо на территории, относившейся к Российской империи или СССР, как в действующем законе, но и тем, кто родился или имеет родственников по прямой восходящей линии, родившихся в России.

  «Очевидно, что документально подтвердить постоянное проживание значительно труднее, чем рождение, — поясняет депутат. — Документы о рождении являются документами длительного хранения в отличие от данных о прописке. Свидетельства о рождении, как правило, хранятся в семьях, и в архивах ЗАГС их найти легче, чем подтвердить факт постоянного проживания в архивах жилищно-коммунальных служб».

   Предложенная поправка снимает ограничение нынешними границами Российской Федерации территории происхождения носителя русского языка, что позволит лицам, происходящим с исторических российских земель, которые в настоящее время лишены самой возможности попасть на собеседование в комиссии по признанию носителем русского языка, претендовать на данный статус.

   Другая поправка касается особенности действующей процедуры получения гражданства России носителями русского языка. Главное препятствие на пути к гражданству РФ носителей русского языка в том, что от них в соответствии с частью 2. 1 статьи 14 ФЗ «О гражданстве РФ» требуется предоставить документ «полномочного органа иностранного государства» удостоверяющий выход из иного гражданства, в то время, как другим иностранным гражданам достаточно письменно заявить о своем отказе от имеющегося у них гражданства.

   По действующему закону начать процедуру выхода носитель русского языка должен еще перед обращением за видом на жительство. Заявление о выдаче вида на жительство подается носителем русского языка, с представлением документа полномочного органа иностранного государства, подтверждающего обращение данного иностранного гражданина с заявлением об отказе от имеющегося у него гражданства иностранного государства. «Подобного требования не предъявляется никому, кроме носителей русского языка», — акцентирует автор законопроекта. — Любой другой иностранный гражданин получает вид на жительство в России без отказа от своего иностранного гражданства. Тем самым для «носителей русского языка» фактически установлен разрешительный (со стороны иностранного государства) порядок отказа от имеющегося гражданства».

   По мнению К.Затулина, «процедуры получения вида на жительство и самого гражданства России поставлены в зависимость от иностранных регламентов, от волюнтаризма иностранных чиновников, от политических проблем и текущих взаимоотношений между Россией и страной гражданства носителя русского языка». Так, Узбекистан не признает Крым российским и в посольстве этой страны не принимают заявлений о выходе из гражданства от граждан Узбекистана, ставших носителями русского языка в Крыму, что закрывает для них право на получение вида на жительство и на гражданство России. Гражданам Украины, носителям русского языка, находящимся в Крыму, также фактически отказано в праве на гражданство России. За два года действия норм для носителей русского языка гражданство смогли получить те, кто иного гражданства не имел.

   По данным Главного управления МВД России по миграции из тысячи носителей русского языка, имеющих гражданство Украины, только 24 человека получили российское гражданство. За время действия нормы только 20 тысяч человек признаны носителями русского языка, из которых российское гражданство смогли получить не более 6% (около 1 тысячи человек).

   Законопроектом вносятся поправки в действующий Закон «О правовом положении иностранных граждан в РФ», дающие право носителям русского языка на получение вида на жительство без заявления об отказе от иного гражданства, а также — устанавливают сроки действия вида на жительство и возможности его продления по общему для иностранцев порядку.

   Как подчеркивает автор, для того, чтобы «носители русского языка» получили право отказываться от иного имеющегося гражданства в таком же порядке, как и другие иностранные граждане, не требуется вносить поправки в Федеральный закон «О гражданстве РФ», но необходимо изменить редакцию абзаца пятого подпункта «г.1» пункта 14 Положения о порядке рассмотрения вопросов гражданства.

   Законопроект не предусматривает дополнительных расходов, покрываемых за счет федерального бюджета.

  В случае принятия настоящий Федеральный закон вступит в силу в день его официального опубликования, но потребуется внесение изменений в Положение о порядке рассмотрения вопросов гражданства Российской Федерации, утвержденное Указом Президента РФ от 14 ноября 2002 г. № 1325.

   Ранее, в декабре 2016 года, с аналогичной инициативой № 54735-7 «О внесении изменений в статьи 14 и 35 Федерального закона «О гражданстве Российской Федерации» выступили Ярослав Нилов, Алексей Диденко, Александр Шерин и Сергей Иванов, предложившие упростить принятие гражданства России для этнических русских.

   Законопроектом предлагается внести изменение в действующее законодательство в части установления упрощенного порядка приема в гражданство Российской Федерации иностранных граждан и лиц без гражданства, если национальность хотя бы одного из родителей в акте о рождении указана как русский. Иностранные граждане и лица без гражданства могут подтвердить принадлежность к русской национальности иными свидетельствами. При этом для таких лиц не требуется соблюдение условий о непрерывном проживании на территории России в течение 5 лет и предоставления вида на жительство, подтверждения законного источника средств к существованию, сдачи экзамена на определение уровня знаний русского языка.

  Свою законодательную инициативу депутаты объясняют обострением политической ситуации на Украине, развязанной националистами и продолжающейся на протяжении последних двух лет гражданской войной. Как указывают авторы законопроекта, «националистические украинские движения воюют с русскоязычным населением, заявляют о необходимости лишать украинского гражданства жителей русского происхождения»; «в сложившихся обстоятельствах права и свободы русского населения оказываются ущемлены (право на родной язык, право на получение образования на родном языке, политические права), между тем, на Украине проживает более 10 миллионов этнических русских». В пояснительной записке к законопроекту депутаты настаивают на принятии «реальных мер по защите русского населения, предоставив им возможность беспрепятственного въезда в Россию и получения российского гражданства в кратчайшие сроки».

   Согласно данной законодательной инициативе, потребуется начать процедуру отказа от имеющегося гражданства, но не предоставлять справку о выходе из гражданства, за исключением случаев, когда международным договором урегулирован вопрос двойного гражданства, а решение о приеме в гражданство будет осуществляться в течение трех месяцев со дня подачи соответствующего заявления.

  Принятие этой законодательной инициативы также потребует внесения изменений в нормативно-правовые акты Российской Федерации: Указ Президента России № 1325 «Об утверждении Положения о порядке рассмотрения вопросов гражданства Российской Федерации» от 14 ноября 2002 года и Приказ ФМС России от 19 марта 2008 года № 64 «Об утверждении Административного регламента исполнения Федеральной миграционной службой государственной функции по осуществлению полномочий в сфере реализации законодательства о гражданстве Российской Федерации» (зарегистрирован в Минюсте России 9 апреля 2008 года, № 11493).

 

Источник: Госдума РФ http://www.duma.gov.ru/news/273/1847713/?sphrase_id=2480119


 

НОСИТЕЛИ РУССКОГО ЯЗЫКА — Переселение в Россию вне госпрограммы — Переселение

Федеральным законом от 20.04.2014 № 71-ФЗ «О внесении изменений в Федеральный закон «О гражданстве Российской Федерации и отдельные законодательные акты Российской Федерации» добавлено еще одно основание для упрощенного порядка получения гражданства Российской Федерации.

Так, теперь гражданство Российской Федерации могут получить иностранные граждане, признанные носителями русского языка, для того, чтобы претендовать на получение этого статуса, необходимо подтвердить владение русским языком и повседневное использование его в семейно – бытовой и общественных сферах, а также, что немаловажно, документально подтвердить, что иностранные граждане, претендующие на получение статуса носителя русского языка, либо их родственники по прямой восходящей линии постоянно проживают или ранее постоянно проживали на территории Российской Федерации либо на территории, относившейся к Российской Империи или СССР в пределах государственной границы Российской Федерации.

Оценивают качество владения русским языком специально созданные в органах ГУВМ МВД комиссии по признанию иностранного гражданина или лица без гражданства носителем русского языка, в которые включены не только сотрудники ГУВМ, но и представители научных, образовательных организаций субъектов. В рамках работы комиссий оценивается возможность иностранного гражданина понимать и интерпретировать тексты на русском языке на любую тематику, умение свободно использовать его в разговорной речи и т.д.

Документальным подтверждением факта проживания иностранного гражданина или егородственников по прямой восходящей линии на территории РФ, на территории, относившейся к Российской Империи или СССР в пределах государственной границы Российской Федерации могут выступать следующие документы: вид на жительство иностранного гражданина на территории РФ, выписка из домовой книги, копия поквартирной карточки, документ, содержащий сведения о постановке лица на воинский учет, военный билет, архивные справки, копии документов Архивного фонда и т.д.

Кроме того, иностранный гражданин должен подтвердить родство с указанными родственниками посредством предоставления свидетельства о рождении или свидетельства об усыновлении и документов (или архивных выписок таких документов), подтверждающих смену собственной фамилии и указанных родственников, в случае смерти родственника – свидетельство о смерти.

По результатам заседания комиссии заявителю выдается решение о признании носителем русского языка либо об отказе в предоставлении указанного статуса. В случае отказа в предоставлении заявителю статуса носителя русского языка он вправе повторно обратиться с заявлением, но не ранее, чем по истечении одного года после принятия отрицательного решения.

Решение комиссии о признании иностранного гражданина носителем русского языка позволит ему подать документы сразу на вид на жительство, минуя стадию получения разрешения на временное проживание, а после получения вида на жительство получить гражданство РФ в упрощенном порядке.

При подаче пакета документов на вид на жительство заявитель должен предоставить документ полномочного органа иностранного государства, подтверждающий обращение данного гражданина с заявлением об отказе от имеющегося гражданства.

Важно! Срок рассмотрения заявления о выдаче вида на жительство для категории иностранных граждан, получивших статус носителя русского языка, составляет 2 месяца. Сам вид на жительство для указанных лиц выдается на 3 года и не может быть продлен.

После получения носителем русского языка вида на жительство в Российской Федерации гражданин вправе сразу обратиться с заявлением о приеме в гражданство в упрощенном порядке. При подаче заявления необходимо подтвердить наличие законного источника средств к существованию и предоставить сведения об отсутствии у заявителя на день подачи пакета документов гражданства иностранного государства, либо документально подтвердить невозможность отказа от него.

Срок рассмотрения заявления о приеме в гражданство для носителей русского языка составляет три месяца с момента приема заявления.

Важно! Процедура приема в гражданство для носителей русского языка занимает три месяца, но только после оформления вида на жительство и полного выхода из имеющегося гражданства.

Источник: http://гражданство.рф

Пресс-служба Россия в Кыргызстане

 

КВОТА НА РВП

Заявление на квоту

Перечень документов на квоту

 

РВП

Перечень док-тов на РВП (без визы)

Перечень док-тов РВП (виза)

Перечень док-тов на РВП для ребенка

Перечень док-тов для ежегодной перерегистрации РВП

Квитанция на оплату госпошлины за РВП

Заявление на РВП

Приложение к заявлению на РВП о родственниках

 

ВИД НА ЖИТЕЛЬСТВО

Перечень док-тов для ВнЖ (общий)

Перечень док-тов для ВнЖ (Беларусь)

Перечень док-тов для ежегодной перерегистрации ВнЖ

Перечень док-тов для продления ВнЖ

Квитанция на оплату госпошлины за ВнЖ

Заявление на ВнЖ

 

ГРАЖДАНСТВО РФ

Перечень док-тов на гражданство

Перечень док-тов на гражданство ребенку

Отказ от имеющегося гражданства (образец)

Квитанция на оплату госпошлины за гражданство

Квитанция на оплату госпошлины за паспорт РФ

Заявление на гражданство

Приложение к заявлению на гражданство о родственниках

 

НОСИТЕЛЬ РУССКОГО ЯЗЫКА

Перечень документов для получения статуса носителя русского языка

Признается ли диплом ВУЗа заменой сертификата носителя русского языка?

Здравствуйте Ольга. Не » носител русского языка» называется это, а Документ, подтверждающий владение данным иностранным гражданином русским языком, знание истории России и основ законодательства Российской Федерации. Если Вы получили диплом до 1 сенября 1991 года, тогда он может заменить сертификатом о владении русским языком и его можете использовать При оформлении РВП

Вот из официального сайта УВМ МВД:

Перечень документов, подаваемый для получения разрешения

Для получения разрешения иностранный гражданин подает в территориальный орган ФМС России по месту предполагаемого проживания либо в дипломатическое представительство или консульское учреждение Российской Федерации в государстве своего проживания:

1. Заявление о выдаче разрешения на временное проживание (приложение № 3 к названному Административному регламенту) в двух экземплярах.

2. 2 личные фотографии размером 35 x 45 мм в черно-белом или цветном исполнении с четким изображением лица анфас без головного убора. Лица без гражданства предоставляют 3 фотографии.

Допускается предоставление фотографий в головных уборах, не скрывающих овал лица, гражданами, религиозные убеждения которых не позволяют показываться перед посторонними лицами без головных уборов.

Для граждан, постоянно носящих очки, обязательно фотографирование в очках без тонированных стекол.

3. Документ, удостоверяющий личность.

4. Документ, выданный полномочным органом государства постоянного проживания, подтверждающий отсутствие судимости у заявителя. Документ не должен быть выдан ранее 3 месяцев на день подачи заявления о выдаче разрешения.

5. Вид на жительство или иной документ, выданный полномочным органом иностранного государства, который подтверждает проживание иностранного гражданина вне государства его гражданской принадлежности.

6. Документ, выданный полномочным органом иностранного государства или полномочным учреждением здравоохранения Российской Федерации, подтверждающий отсутствие заболевания наркоманией и инфекционных заболеваний, которые представляют опасность для окружающих, предусмотренных перечнем, утвержденным приказом Министерства здравоохранения Российской Федерации от 29 июня 2015 г. № 384н.

7. Сертификат об отсутствии у заявителя заболевания, вызываемого вирусом иммунодефицита человека (ВИЧ-инфекции).

8. Документ, подтверждающий владение данным иностранным гражданином русским языком, знание истории России и основ законодательства Российской Федерации. К таким документам относятся: сертификат о владении русским языком, знании истории России и основ законодательства Российской Федерации; документ государственного образца об образовании (на уровне не ниже основного общего образования), выданный образовательным учреждением на территории государства, входившего в состав СССР, до 1 сентября 1991 года; документ об образовании и (или) о квалификации, выданный лицам, успешно прошедшим государственную итоговую аттестацию на территории Российской Федерации с 1 сентября 1991 г.

https://xn--b1aew.xn--p1ai/Del…

Удачи Вам

Холокост в годы Второй Мировой войны

 

КИЕБЙ! Эр эйафлй уэй епшза язшзеиз ънйзвояйказдр! Эйафлй мпнпв мйбйнйяидъю ‑ эрояйуэњшф эзлъэ мй лйецп, йлзв> ;)Мпнпв епуиъэйэс; эсэ ймие шапл, асушзгплпжи япкйэс еп

и ез опяфъю‑ др нъњ ъмзапзд гп эзкю! Мпжз зъаи йъэпаъю

ймие

 

мзеф

мй ъмпуи япкйэр ‑ др ъояпнидъю,и эр ойасуишф «Йэаиуей° ой ънйздсоязмдзэс! Эйафлй оязмъэпнф; эргпеидпзшфъю ънйид ащкидрд мзайд, ойлпэнйи ймейбясооеили эзяющэ ънйи езянерзлазэли… Ояйеилеиъф… Хэй кзъцзеейз йтстзеиз ;)Лсяъйнпю, миоайд, язьзяпэ, ъэпэфю, хъъз, узяэзжи, гпмпуи ой дпэпес, лйеэяйафепю иаиэнйяузълпю япкйэп ‑ нъњ хэй эр дйжзшф озязмпэф епд, епъапжмпэфъю ънйзв дйаймйъэфщ,бсаюэф ъ мясгфюди и япмйнпэф яймиэзазв йэаиуерди йцзелпди. П зъаи оязоймс уэй-эй езойеяпниэъю, эй др

кзъоапэей

озязмзапзд эпл, уэй йе осъэиэ ъазгс йэ ъупъэфю иойъэпниэ энйщ япкйэс н япдйулс лпл йкяпгзц лпузъэнп.Зтњ ъйдезнпзшфъю> Др бйэйнр оймпяиэф эзкз

ъйэеи упъйн ънйкймейбй няздзеи

 гпъдзшесщ цзес ‑ уэй эсэ мсдпэф-эй>! Жигеф ймеп ‑ ез эяпэф зњ еп нъюлсщ ьибещ! Озязвми еп епш ъпвэ

— йкзтпщ, эзкз ойеяпниэъю! ;)П япкйэп, лйэйясщ эр иълпа, епчймиэъю еижз 😉

Ннзмзеиз

Ъяпгс жз ой йлйеупеии нэйяйв дияйнйв нйвер н Бзядпеии нйгеилнйзеей-иъэйяиузълив язнигийеигд. Имзйайбиузълйв гпмпузв язнигийеиъэйнкрай йкзазеиз епциъэълйв Бзядпеии, ъэяздазеиз ъеюэф ъ езз йкниезеиз нпбязъъии и нйзеерч оязъэсоазеиюч. Эплжз иъэйяили-язнигийеиъэр орэпаиъфйэяицпэф ъпдрв ьплэ бзейцимп знязвълйбй епяймп. Н епъэйютзз няздю бйайъпйэяицпэзазв Чйайлйъэп лпл ймейбй иг лясоезвшич оязъэсоазеив н иъэйяииузайнзузъэнп ез сдйалпщэ, п шияюэъю.Ояйказдп мпеейв лсяъйнйв япкйэр гплащупзэъю н эйд, уэйкр мйлпгпэф,уэй пеэиъздиэигд, идзншив дзъэй еп эзяяиэйяии Бзядпеии зтз нй няздзепъязмезнзлйнфю, мйъэиб усмйнитерч япгдзяйн ъ ояичймйд л напъэи епцийепа-ъйципаиъэйн и йкзяесаъю эяпбзмизв маю диааийейн ащмзв, озязжиншичЧйайлйъэ.Н дияз мзвъэнсзэ дейжзъэнй дйбстзъэнзеерч ъиа, ънюгпеерч ъепъазмизд епцийепа-ъйципаигдп, аикй мзапщтич ъэпнлс еп япгжибпеиз

В замешательстве; гражданин США и мой родной язык — Форум родителей


[цитата]

[Цитата]

Студенты из США обычно (или никогда?) Не должны сдавать экзамен TOFFEL или что-то в этом роде.

[/ quote]

В некоторых колледжах довольно строгие языковые требования для не носителей языка. Вот политика SUNY Stony Brook:


[Цитата]

Все кандидаты должны подтвердить свое знание английского языка.TOEFL, IB TOEFL или IELTS должен сдавать любой, чей родной язык не английский, даже если вы учились в средней школе в Соединенных Штатах.

[/ quote]

[/ quote]

Однако студент не является иностранным студентом, поэтому это не относится к нему или к ней.

ОП слишком много думает об этом, поскольку ответ правильный в его / ее стенограмме / школьных записях.

Поскольку Оп живет и ходил в школу в Нью-Йорке, когда он / она впервые пошли в школу, родителям пришлось заполнить анкету по изучению домашнего языка.

Если родным языком родителей не был английский, учащийся автоматически проверялся на знание английского языка.

Учащийся не владеет языком, он / она был переведен на ESL / двуязычное образование (что является обязательной услугой).

Студент будет запрограммирован на услуги ESL. Если студент более высокого уровня ESL, он / она будет запрограммирован на ESL и английский одновременно.

Студент остается на ESL до тех пор, пока студент не сдаст экзамен на NYSESLAT, который проводится каждый май.

Вопрос в том, были ли вы сейчас или когда-либо назначены студентом ESL?

Если да, то английский не считается вашим родным языком.

Если вы изучали английский как иностранный, прошли ли вы экзамен NYSESLAT, который продемонстрирует ваше умение читать, писать и говорить по-английски? Я знаю, что это может очень расстроить некоторых студентов, которые спрашивают, почему их назвали ESL, когда они могут читать и писать по-английски и хорошо успевают в своих классах.Тем не менее, вы должны оставаться в ESL до тех пор, пока не пройдете тестирование.

Если вы не сдадите экзамен, вы будете запрограммированы на ESL по вашей текущей программе (информацию можно получить в GC), у вас будет еще одна возможность сдать экзамен в мае.

Поиск голландцев на онлайн-форумах

Forensic Sci Res. 2018; 3 (3): 230–239.

Бернард ван ден Бум

а Лейденский университет, Лейденский институт передовых компьютерных наук (LIACS), Лейден, Нидерланды;

Кор Дж.Винман

а Лейденский университет, Лейденский институт передовых компьютерных наук (LIACS), Лейден, Нидерланды;

б Нидерландский институт судебной экспертизы, Гаага, Нидерланды;

c TNO, Гаага, Нидерланды,

а Лейденский университет, Лейденский институт передовых компьютерных наук (LIACS), Лейден, Нидерланды;

б Нидерландский институт судебной экспертизы, Гаага, Нидерланды;

c TNO, Гаага, Нидерланды,

Поступило 02.02.2018 г .; Принята в печать 25 мая 2018 г.

Copyright © 2018 Автор (ы). Опубликовано Taylor & Francis Group от имени Академии судебной медицины. Это статья в открытом доступе, распространяемая в соответствии с лицензией Creative Commons Attribution License (http://creativecommons.org/licenses/by/4.0), которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии правильного цитирования оригинальной работы.

Реферат

Правоохранительные органы имеют ограниченную зону действия их полномочий, которая называется их юрисдикцией.Эти ограничения также распространяются на Интернет. Однако в Интернете трудно обнаружить физические границы юрисдикции, обычно границы страны. В нашем случае сложно установить, действительно ли кто-то, замешанный в преступном поведении в Интернете, является гражданином Нидерландов. Мы предлагаем способ преодолеть трудную задачу вручную выяснить, является ли пользователь Интернет-форума голландцем или нет. Точнее, мы стремимся обнаружить, что данный текст на английском языке написан автором-коренным голландцем.При разработке детектора мы применяем подход машинного обучения. Поэтому нам нужно подготовить конкретный тренировочный корпус. Чтобы получить репрезентативный корпус для онлайн-форумов, мы собрали на Reddit большое количество сообщений на английском форуме от голландских и не голландских авторов. Чтобы изучить модель обнаружения, мы использовали представление набора слов для выявления возможных орфографических ошибок, грамматических ошибок или необычных оборотов фраз, характерных для родного языка авторов. Для этой обучающей задачи мы сравниваем машину линейных опорных векторов и регуляризованную логистическую регрессию с использованием соответствующих показателей производительности f 1 балл, точность и средняя точность.Наши результаты показывают, что логистическая регрессия с выбором признаков на основе частоты лучше всего подходит для прогнозирования голландцев. Дальнейшее исследование должно быть направлено на общую применимость результатов, то есть, чтобы выяснить, применимы ли разработанные модели к другим форумам с сопоставимой высокой производительностью.

Ключевые слова: Криминалистика, анализ текста, профилирование авторов, создание корпуса, большие данные, разведка с открытым исходным кодом, проверка родного языка

Введение

Полиция и спецслужбы, несомненно, борются с огромным объемом текстового контента, который является размещены в сети, некоторые из которых имеют криминальный характер.Поиск такого типа сообщений во всей сети — непростая задача. Совершенно очевидно, что преступники используют Интернет как средство продажи незаконного оружия или наркотиков, а также в более крайних случаях, таких как предложение услуг наемных убийц. Нас особенно интересует контент, размещенный в так называемой даркнете, который чаще носит криминальный характер. Наиболее часто встречающийся контент, связанный с преступностью, включает черные рынки, детскую порнографию, мошенничество или услуги по доставке по почте.

Помимо огромных размеров Интернета, у агентств есть еще одна проблема.Голландские правоохранительные органы не могут отслеживать пользователей, вовлеченных в преступную деятельность в Интернете, находящуюся за пределами их юрисдикции. Действительно, найти голландских граждан можно так же просто, как определить язык в онлайн-сообщениях [1]. Однако Интернет — это глобальное место встреч, где многие из соответствующих общественных форумов содержат в основном сообщения на английском языке. Другими словами, спецслужбы имеют дело с масштабами Интернета, содержащего криминальный контент от пользователей самых разных национальностей, который имеет для них лишь частичное отношение.Срочно необходима система для поддержки идентификации голландских граждан среди пользователей Интернета.

В случае, если все следы пользователей — это англоязычных сообщений, проблема поиска голландских граждан сводится к идентификации англоязычных сообщений, написанных голландскими коренными жителями. Проблема тесно связана с проблемой идентификации родного языка (NLI) [2]. В NLI проблема состоит в том, чтобы определить родной язык автора, где родным языком может быть любой из заданного набора языков.Идея состоит в том, что тексты, написанные не носителями языка, содержат скрытые подсказки, выдающие их родной язык. Писатели склонны к орфографическим ошибкам, грамматическим ошибкам или необычным оборотам фраз, характерных для их родного языка. В этом исследовании первая цель — использовать возможности машинного обучения и автоматического анализа текста, чтобы раскрыть эти подсказки и обнаружить тексты на английском языке, написанные голландскими авторами. С точки зрения правоохранительных органов, проблема здесь в том, чтобы определить, находится ли плакат в их юрисдикции — да или нет.Другими словами, мы имеем дело с проблемой Native Language Verification (NLV).

Как и другие специалисты, занимающиеся связанными проблемами, мы следуем парадигме машинного обучения, чтобы разработать метод, позволяющий отличать сообщения голландцев от сообщений неголландцев. Для такого подхода, основанного на данных, нам необходим репрезентативный текстовый корпус с достоверной информацией на родном языке.

С точки зрения машинного обучения проблема NLV может быть сформулирована как проблема классификации с двумя классами, где классы равны 1 и 0 в зависимости от того, кто родился в Голландии.Напротив, общая проблема NLI приводит к проблеме классификации нескольких классов, где каждый возможный родной язык формирует класс. Задачи двухклассовой классификации имеют ряд преимуществ, которые мы используем в этом исследовании. Во-первых, несколько наиболее эффективных классификаторов для задач аналитики многомерного текста в основном предназначены для задач двух классов, таких как машина опорных векторов (SVM) и логистическая регрессия. Применение таких методов к мультиклассовым задачам требует адаптации с помощью мультиклассовой оболочки за счет оптимальности.Во-вторых, для задачи NLI точность обычно используется в качестве показателя эффективности [3]. Эта мера подвержена дисбалансу классов [4], который обычно присутствует в этой области. Для двухклассовых задач существуют проверенные и проверенные меры, которые устойчивы к классовой дисбалансу и допускают легкую интерпретацию, такие как кривая ROC [5] и ее агрегированная площадь под кривой ROC (AUC), а также точность и отзыв [6 ]. Более того, эти показатели хорошо подходят для измерения эффективности и ранжирования постов от наиболее вероятного коренного голландца до наименее вероятного голландца.

В это исследование было внесено два основных вклада:

  1. Мы предлагаем рецепт построения корпуса с сообщениями на английском языке с наземными метками для коренных голландцев и для коренных не голландцев. Понятно, что это можно перевести на любой другой язык.

  2. Мы предлагаем метод ранжирования сообщений или их пользователей для задачи проверки на родном языке.

Данная статья имеет следующую структуру. В следующем разделе излагается проблема, с которой мы работаем формально.Затем в разделе Связанные работы обсуждается литература, имеющая отношение к нашей работе. Раздел Corpus описывает процесс сбора корпуса. Раздел Метод дает обзор метода, связанного с машинным обучением, включая извлечение признаков и обучение модели. В следующих разделах мы сообщаем о методе оценки и результатах проведенных нами экспериментов. Мы завершаем обсуждение, выводы и прогноз.

Постановка проблемы

Проблема, с которой мы имеем дело в этом исследовании, заключается в том, чтобы предоставить правоохранительным органам инструмент, позволяющий отличать английский текст, написанный голландскими авторами онлайн от английского текста, написанного не голландскими авторами.Точнее, для коллекции постов разных авторов на английском языке задача состоит в том, чтобы ранжировать их от наиболее вероятных авторов-носителей голландского языка до наименее вероятных авторов-носителей голландского языка. Для этой задачи мы используем только произнесенный письменный текст, потому что возможные доступные метаданные, такие как IP-адреса, могут быть трудно отслеживаемыми по разным причинам, что выходит за рамки данного исследования.

Связанные работы

Проблема распознавания на родном языке затрагивает различные задачи классификации текста, такие как профилирование авторов [7], атрибуция авторства [8], идентификация программистов [9], классификация обзоров [10] и анализ настроений в Twitter [11] ].

Из современных классификационных проблем определение родного языка явно ближе всего к нашей проблеме, см., Например, [2,12,13]. Большая часть исследований по идентификации родного языка использует изучающих английский документы в качестве учебного корпуса [2,3,14]. Популярным таким ресурсом является корпус Test of English as a Foreign Language (TOEFL), который содержит тексты, которые используются для проверки готовности студентов к обучению в англоязычной стране [15].

Большинство этих задач классификации документов выполняется довольно стандартным способом [16].Сначала они собирают текстовые данные. Затем в процессе предварительной обработки тексты токенизируются, стоп-слова удаляются, а слова выделяются. Часто следует этап индексации, например, с использованием модели векторного пространства, создания векторов символов, слов, комбинаций символов или комбинаций слов. В результате пространство функций может стать действительно огромным. Результирующая проблема размерности, или проклятие размерности, обычно решается с помощью методов выбора признаков, основанных на получении информации, частоте терминов или выполнении теста хи-квадрат [17–19].

После того, как данные подготовлены в некотором формате вектора признаков, можно применить машинное обучение для получения классификатора текста. В прошлом использовалось много разных моделей, одни с большим успехом, чем другие. Часто для решения размерности проблемы используются регуляризованные машинные обучающиеся (в дополнение к схемам выбора признаков), такие как SVM [20], Lasso [21] и регуляризованная логистическая регрессия [22]. Другие используемые методы — это наивный Байес [11,23], классификатор ближайшего соседа k [24], деревья решений [11] и классификаторы случайного леса [25].

Corpus

В этом разделе мы обсуждаем наш рецепт сбора корпуса. Чтобы получить репрезентативный корпус достаточного размера для задачи NLV на онлайн-форумах с потенциальной преступной деятельностью, мы предпочтительно использовали бы контент из темной сети. Однако получить эти данные сложно, а иногда даже незаконно. В качестве альтернативы, платформа Reddit [26] является подходящей альтернативой, которая обеспечивает легкий доступ к их контенту. Ниже мы подробно расскажем, как мы собирали данные и получали нативные голландские и нидерландские ярлыки для пользователей платформы.

Reddit

Reddit — это онлайн-сообщество, где зарегистрированные пользователи могут, среди прочего, отправлять контент, голосовать за публикации и комментировать их. В настоящее время существует около 40 миллионов учетных записей пользователей. Посетители также могут просматривать большую часть контента, не имея учетной записи [26]. Почти все разделы Reddit на английском языке; Большинство пользователей Reddit — из США. Точные данные о том, откуда пришли пользователи Reddit, не являются общедоступными. В соответствии с Постановлением о проблеме в этой работе мы не используем метаданные, которые в любом случае трудно получить с помощью Reddit.

Сбор данных

Reddit предоставляет интерфейс прикладного программирования (API) [27], код которого является открытым. Он поддерживает множество методов, включая сбор данных от определенных субреддитов и пользователей путем выполнения различных вызовов. Субреддит — это подфорум на Reddit, которые вместе образуют Reddit. Для этого исследования комментарии собираются с помощью этих методов и пакета Python, который обеспечивает простой доступ к API Reddit [28]. Мы создаем помеченный набор данных, в котором все комментарии пользователя собираются в один документ.Правоохранительным органам необходимо знать, находится ли пользователь в пределах их юрисдикции, поэтому им не нужно классифицировать отдельные комментарии. В литературе по идентификации авторства это называется классификацией на основе профиля, в отличие от ее противоположной классификации на основе экземпляров [29], где мы будем рассматривать каждый комментарий пользователя как отдельный случай. Преимущество состоит в том, что для задачи можно использовать более крупные фрагменты текста.

Голландские пользователи

Чтобы правильно классифицировать пользователей как голландцев или не голландцев, мы сначала получаем данные, из которых можно с достаточной уверенностью узнать, что они являются коренными голландскими пользователями.Данные собираются с помощью следующего процесса:

  1. Поскольку подавляющее большинство субреддитов не голландские, список крупнейших голландских субреддитов, которые удалось найти, был собран вручную. В итоге мы получаем около 900 пользователей из некоторых крупнейших субреддитов, которые, по наблюдениям, находятся на голландском языке. Мы исходим из предположения, что пользователи, которые оставляют комментарии на голландском языке, являются голландцами.

  2. Для каждого из этих голландских пользователей мы извлекаем комментарий , который пользователь прокомментировал на определенном языке , что было обнаружено Googles language-detection, перенесенным на Python [30] в определенном субреддите .В итоге мы получили около 540 000 записей от голландских пользователей.

  3. В качестве последнего шага мы удаляем записи, содержащие комментарии на голландском или любом другом языке, отличном от английского, которые обнаружил детектор языка. В результате получилось около 400 000 комментариев на английском языке от предполагаемых голландских пользователей.

Хотя каждый комментарий проходит через детектор языка, он не кажется полностью эффективным. Детектор языка ошибочно определяет некоторые комментарии — и, следовательно, некоторых пользователей — как говорящих на определенном языке.Это происходит потому, что (1) некоторые комментарии слишком короткие для классификации и (2) некоторые комментарии содержат необычные символы, такие как смайлики или специфический сленг Reddit. Трудно сказать, сколько ошибок действительно делает детектор языка, потому что количество комментариев слишком велико, чтобы проверить их вручную. Некоторые короткие комментарии могут быть помечены правильно, а другие — неправильно. Действительно, детектор языка рекомендует использовать тексты объемом более 10–20 слов [30].

Пользователи, не являющиеся голландцами

Поскольку мы проводим различие только между уроженцами Нидерландов и уроженцами, не являющимися голландцами, мы предполагаем, что все пользователи, которые не публикуют комментарии на голландском языке, не являются пользователями из Нидерландов.Действительно, те голландские пользователи, которые публикуют сообщения только на английском, ошибочно будут считаться англичанами. Однако количество таких пользователей будет значительно меньше, чем истинно не голландцев, поэтому, скорее всего, это не помешает алгоритмам обучения [31]. Точный процесс сбора не голландских пользовательских данных и попытки определить их родной язык выглядит следующим образом:

  1. Чтобы составить первоначальный список не голландских пользователей, мы берем 200 лучших субреддитов, где Голландские пользователи из голландских данных пользователей разместили на (на английском языке).Это позволяет оставлять комментарии, не относящиеся к широко различающимся темам, что, скорее всего, приведет к переобучению данных в дальнейшем. Идея здесь в том, что набор данных становится более однородным, если мы собираем комментарии из субреддитов, в которые комментируют как голландские коренные жители, так и не голландские пользователи. Из каждого из этих субреддитов в созданном списке субреддитов мы собираем как можно больше пользователей и отфильтровываем всех голландских пользователей, которых мы нашли в наших голландских пользовательских данных. Теперь у нас есть временный список из 90 000 пользователей, не являющихся голландцами.Это 100 не голландских пользователей на каждого голландского пользователя.

  2. Шаг 2 идентичен шагу 2 процесса сбора данных о пользователях в Нидерландах, за исключением того, что мы собираем меньше комментариев для каждого пользователя, потому что просто больше пользователей, от которых можно собирать данные. Сбор этих данных занимает пару дней и приводит к созданию большого CSV-файла размером около 2,5 ГБ с теми же полями заголовка, что и голландский набор пользовательских данных.

Теперь, когда доказано, что детектор языка не так эффективен для коротких комментариев и / или «странных» символов, и нет возможности проверить, насколько хорошо он работает, делается попытка классифицировать субреддиты вместо отдельных комментариев , на определенном языке.Если мы предположим, что пользователю присвоен язык -1 , если субреддит находится на иностранном языке и некоторые пользователи публикуют сообщения в этом субреддите, мы можем в конечном итоге сопоставить пользователей с языком. Мы надеемся, что сабреддиты содержат достаточно комментариев, чтобы правильно определить его язык и, следовательно, язык пользователя. Часто субреддиты находятся на том или ином языке, не смешивая языки в конкретном субреддите. Язык субреддита определяется следующим образом:

  1. Создайте список уникальных субреддитов из не голландских пользовательских данных.Это все субреддиты, в которых, предположительно, комментируют не голландские пользователи.

  2. Из каждого субреддита 30 комментариев захватываются и объединяются. 30 дает достаточно большой набор комментариев, который может быть проверен детектором языка.

  3. К этой конкатенации мы применяем детектор языка.

  4. Обнаруженный язык связан с уникальным субреддитом. Результатом является набор данных с субреддитами и соответствующим им языком.

После того, как мы определили язык сабреддита для всех сабреддитов, на которых публиковали наши предполагаемые неголландские пользователи, мы удаляем всех пользователей, которые публикуют сабреддиты на голландском языке, из нашего не голландского набора данных и добавляем их в наш голландский набор данных.

Наконец, мы объединяем все комментарии, принадлежащие пользователю, в один фрагмент текста. Вследствие объединения комментариев алгоритму машинного обучения, скорее всего, будет проще в конечном итоге классифицировать документы. То есть они содержат больше данных, из которых нужно извлечь информацию. По этой же причине удаляются пользователи с составными текстами короче 2 000 символов. Это снижает вероятность ошибок обнаружения коротких текстов, содержащих только неразборчивые символы.

При внимательном рассмотрении вручную мы замечаем, что остается довольно много наборов комментариев, которые включают предложения на голландском языке.Детектор языка, по-видимому, не смог обнаружить эти комментарии по отдельности. По этой причине мы снова запускаем детектор языка, теперь уже в наборе комментариев, удаляя еще около 100 экземпляров голландских пользователей. Мы стараемся сначала удалить как можно больше голландских из отдельных комментариев во время сбора, а затем из наборов комментариев.

Подводя итог, мы собрали данные в два основных этапа. Во-первых, мы в основном вручную создали список голландских пользователей (меньшинство на Reddit), которые публикуют сообщения в голландских субреддитах.Затем мы составили список предварительно не голландских пользователей из субреддитов, в которые публикуются голландские пользователи. Мы дважды проверили, не являются ли они не голландцами, сопоставив пользователей с голландскими данными и определив язык, в каких субреддитах они публикуют. удалены строки наборов комментариев, которые были снова пропущены через детектор языка и помечены как неанглийские. Теперь данные готовы к преобразованию в функции и имеют формат:

[пользователь] [агрегированные комментарии] [nl / other]

Пользователь — это имя пользователя, агрегированные комментарии — это все собранные комментарии. от конкретного пользователя и объединены вместе, и последний столбец представляет собой один из двух языков: , голландский, , и , английский, (на самом деле все не голландское).

Метод

Извлечение признаков

Чтобы использовать многие алгоритмы машинного обучения, текстовые данные необходимо преобразовать в числовые векторы признаков. Модель набора слов — это подход, широко используемый в области обработки естественного языка [32–34]. При таком подходе мы по существу игнорируем порядок слов: каждый комментарий воспринимается как мультимножество его слов, отслеживая только частоту каждого слова. Эта частота затем используется как характеристика для обучения классификатора.

Наш инструментарий предоставляет множество параметров, с помощью которых можно управлять предварительной обработкой данных, помимо преобразования данных с соотношением «частота терма, умноженная на обратную частоту документа» (tf-idf). Параметры включают в себя удаление диакритических знаков, определение того, следует ли удалять стоп-слова, ввод всех символов в нижний регистр и установку диапазона n -грамм, а также использование символа n -грамм или слова n -грамм. Многие параметры сохранены как можно более простыми и максимально приближенными к современным исследованиям.Ниже мы подробно расскажем о наших шагах и возможных вариантах.

Tf-idf

Сначала мы преобразуем каждую коллекцию комментариев в слова, а затем используем метод, называемый tf-idf. С помощью этого метода мы количественно оцениваем важность слов в документах (коллекциях комментариев), вычисляя для них веса. Самые частые слова — это не всегда слова, содержащие больше всего информации. На самом деле, это часто слова, которые являются так называемыми стоп-словами («то», «и», «или» и т. Д.). Часто более редкие слова могут дать больше информации, независимо от того, является ли пользователь голландцем или нет.Например, голландские пользователи могут совершать определенные орфографические ошибки, которые почти никогда не допускают не голландские пользователи.

Расчет tf-idf выглядит следующим образом:

с f ij частота слова i в документе (объединенные комментарии) j . Таким образом, частота термина i в документе равна f ij , нормированная путем деления на частоту наиболее частого слова в документе. Самый частый термин в комментариях j получает частоту термина 1.Частота обратного документа IDFi = log2 (Nni), где N — общее количество документов и n i — количество документов, содержащих слово i . Тогда Tf-idf становится TFij × IDFi. Более высокие значения tf-idf получаются при высокой частоте для документа, но низкой частоте для всех документов [35].

N -граммы

Использование n -грамм является обычным явлением в задачах классификации текстов, см., Например, [36,12]. С помощью слова n -граммы мы извлекаем из документа n смежных слов.Точно так же мы могли бы использовать слог или символ n -грамм. n -граммы предназначены для того, чтобы в конечном итоге предоставить нам предсказание следующего слова или символа в последовательности слов (например, следующего слова в предложении). Несмотря на свою простоту, n -граммы оказались очень эффективными во многих приложениях. Во время нашего исследования было невозможно протестировать широкий спектр диапазонов n -грамм, хотя это могло улучшить наши окончательные результаты. Первоначальные эксперименты показали, что слово n -грамм работает лучше, чем символ n -грамм.Поэтому мы продолжили исследование, используя слово n -граммы. Кроме того, мы решили использовать униграммы слов, то есть слово n -грамм размера 1, потому что использование биграмм или даже триграмм приводит к проблемам реализации, вызванным большим количеством результирующих функций.

Другие параметры

Мы решили сделать все символы строчными. Мы пишем строчные буквы, чтобы наш словарный запас не увеличивался в размерах, не показывая при этом увеличения производительности согласно ранним тестам.Мы не удаляем акценты и не удаляем стоп-слова. Стоп-слова обычно удаляются при классификации текста, но в нашем случае это может быть полезно, а именно голландские пользователи могут выбирать стоп-слова, отличные от голландских пользователей.

Наконец, мы преобразовываем термин частота в tf-idf в двоичную форму. Чисто благодаря некоторым начальным экспериментам этот параметр показал лучшую производительность. Частоты терминов также по умолчанию нормализованы с использованием нормы l 2.

После извлечения признаков мы получаем 2.3 миллиона функций.

Высокая размерность

Около 2,3 миллиона функций могут вызвать некоторые проблемы. Во-первых, для хранения такого количества функций требуется большой объем памяти. Во-вторых, высокая размерность может привести к ухудшению производительности или даже к переобучению, когда размерность увеличивается, а обучающие выборки остаются фиксированными [37,38]. Переоснащение могло быть прямым результатом этого так называемого проклятия размерности. К счастью, обе наши модели являются линейными и регуляризованными, что при условии правильной настройки параметров штрафа делает их более устойчивыми к переобучению [39].Мы также рассмотрим два способа работы с высокой размерностью наших данных.

Одним из распространенных способов решения проблемы высокой размерности является выбор функций. Выбор функций во многих случаях оказался полезным для упрощения конечной модели без снижения производительности и даже для повышения точности обобщения и предотвращения «переобучения». В недавней литературе взаимная информация, получение информации, частота терминов и хи-квадрат относятся к числу методов выбора признаков, которые оказались наиболее эффективными [40].Мы экспериментируем с хи-квадрат и частотой терминов. Что касается частоты терминов, мы ограничиваем максимальное количество функций, упорядочивая их по частоте в нашем корпусе. При выборе признаков хи-квадрат для выбора признаков используется статистический критерий хи-квадрат [17].

Регуляризация — еще один способ справиться с проклятием размерности. Например, выбор функции может быть выполнен с помощью регуляризации L 1. Однако мы используем регуляризацию L 2, потому что регуляризация L 1 дает худшие результаты.Регуляризация гарантирует, что веса, которые дает модель, не подходят слишком хорошо: значения веса наказываются регуляризацией. Проще говоря, разница между двумя типами регуляризации заключается в том, что регуляризация L 1 может уменьшить веса до нуля, эффективно устраняя их, в то время как регуляризация L 2 также уменьшает веса, но не устраняет их [21].

Обучение модели

Как уже упоминалось в разделе Связанная работа , алгоритмы машинного обучения, которые часто используются с текстовыми данными, включают наивные байесовские или другие байесовские модели, SVM, логистическую регрессию и классификатор ближайшего соседа k .Последний алгоритм обычно довольно медленный и требует много памяти по сравнению с другими. По этой причине он не был включен в эксперименты. Наивный байесовский классификатор показал ограниченную производительность на этом наборе данных в начальных экспериментах, поэтому мы его также не упомянули. Наконец, были протестированы два оставшихся метода: регуляризованная логистическая регрессия (LR) и линейная SVM.

Дисбаланс классов и поддержка модели

Хотя наивный байесовский метод не был идеальным для решения проблемы дисбаланса классов без необходимости расширять Scikit и разрабатывать более продвинутые методы, другие алгоритмы имеют встроенную поддержку для работы с дисбалансом классов.Первостепенное значение имеет устранение классового дисбаланса. Несбалансированность классов в данных — примерно один голландский пользователь на каждые 100 не голландских пользователей — представляет собой новую проблему. К счастью, реализации логистической регрессии и линейной SVM поддерживают вес класса, который корректирует веса в соответствии с дисбалансом. Это делается путем деления общего количества образцов (документов) на количество классов ( голландских или не голландских ), умноженное на частоту метки класса [22]:

weight (y) = # выборки # классы × # вхождений y.

(2)

Логистическая регрессия

Логистическая регрессия — это дискриминативный классификатор, который строит модель на основе характеристик, наиболее характерных для класса [41]. Бинарный классификатор возвращает хорошо откалиброванные несмещенные вероятности, потому что он, прежде всего, оптимизирует логарифмические потери [22,42]. Таким образом, логистическая регрессия работает с вероятностями, в отличие от опорных векторных машин. Это требует настройки параметра C , который мы настраиваем с помощью поиска по сетке, используя среднюю точность в качестве меры производительности.Мы считаем, что C из 1 000 работает лучше всего. По умолчанию реализация sklearn использует l 2-пенализацию. И логистическая регрессия, и регуляризация взяты из библиотеки LIBLINEAR [43].

Машины опорных векторов

Вкратце, цель SVM — найти оптимальную разделяющую гиперплоскость, максимизирующую запас обучающих данных. Как справедливо отмечает Иоахим, SVM — это «универсальные обучающиеся», которые могут учиться независимо от размерности пространства признаков [20].Текстовые данные имеют множество свойств, таких как перечисленные выше, с которыми SVM справляются очень хорошо. Не только теоретически, но и на практике Иоахимс показывает, что SVM показывают хорошую производительность в задачах категоризации текста. Кроме того, как и в случае с логистической регрессией, наша линейная SVM требует только настройки параметра C , штрафного параметра члена ошибки. Мы обнаружили, что C = 0,5 дает наивысшую среднюю точность при поиске по сетке.

Оценка

Перекрестная проверка

Для тестирования моделей мы используем пятикратную перекрестную проверку со стратификацией.Мы стратифицируем, потому что стратификация обычно работает лучше, чем обычная перекрестная проверка, как с точки зрения смещения, так и с точки зрения дисперсии, согласно Кохави [44]. Мы применяем этот метод, разделив наш набор данных на пять подмножеств, используя один из подмножеств в качестве тестового набора, а остальные — как обучающий набор. Мы повторяем этот процесс пять раз, пока каждому подмножеству не будет назначен набор тестов. Поскольку мы используем стратификацию, мы учитываем баланс классов в нашем разделении данных, чтобы он правильно отражал весь набор данных.То есть в каждом подмножестве примерно такой же процент каждого класса, что и в исходном наборе данных. Общая перекрестная проверка поясняется в.

Простая пятикратная перекрестная проверка.

Показатели производительности

Обычно производительность классификатора измеряется точностью. Однако в этом случае точность быстро приблизится к 99%, если бы классификатор всегда помечал комментарий не на голландском языке. Итак, задача состоит в том, чтобы найти подходящую метрику производительности для оценки нашей модели.

К счастью, есть много способов проверить, насколько хорошо бинарный классификатор работает с несбалансированными классами. Кривая рабочей характеристики приемника (ROC-кривая) и его площадь под кривой (AUC) являются такими [45]. Графическая кривая отображает соотношение истинно положительных результатов (TPR) и ложноположительных результатов (FPR) при различных порогах. Затем AUC говорит нам что-то о том, насколько хорошо работает алгоритм; чем выше, тем лучше он предсказывает метку класса. Он равен вероятности того, что классификатор оценит случайно выбранный голландский экземпляр выше, чем случайно выбранный не голландский экземпляр [46].Однако оказывается, что ROC AUC, похоже, не очень хорошо подходит для задач, в которых гораздо больше отрицательных (не голландских), чем положительных (голландских) [6]. Альтернативой, которая не учитывает ложноотрицательные результаты (ЛО), является кривая точного отзыва (кривая PR) и ее площадь под кривой. Этот показатель сравнивает FP с TP, а не TN, и представляет собой компромисс между точностью и отзывом. По этой причине мы выбрали кривую PR и ее AUC, а не кривую ROC. Мы особенно используем область под кривой точного отзыва, которая также известна как средняя оценка точности и описывает кривую точного отзыва:

Еще один полезный показатель производительности, который можно использовать для оценки классификатора, включает f 1 балл, который определяется как среднее гармоническое значение точности и запоминания.Однако в нашем конкретном случае мы предпочли бы позволить нашей модели находить голландских пользователей с высокой вероятностью, а затем находить больше голландских пользователей, но также классифицировать многих не голландских пользователей как голландских. Другими словами, мы готовы обменять некоторый отзыв на большую точность. Мы считаем точность более важной, чем отзыв; у нас скорее ложноотрицательные, чем ложные срабатывания. Тем не менее, с f 1 балл, мы также можем следить за отзывом:

f1 = 2Precision × RecallPrecision + Recall.

(5)

Последние показатели производительности (точность, отзыв, f 1 оценка) — это меры на основе наборов, рассчитываемые с использованием наборов неупорядоченных комментариев. Напротив, кривые точного отзыва предназначены для поиска баланса между точностью и отзывом. Он работает с порогами, которые позволяют нам обменивать точность на отзыв. Производительность в диапазоне пороговых значений можно визуализировать, построив кривую точного отзыва. Его площадь под кривой (средняя оценка точности) обеспечивает отличную метрику производительности для сравнения моделей.

Эксперименты

В следующих экспериментах сравнивается производительность логистической регрессии с машиной линейных опорных векторов. Как уже упоминалось ранее, обучение выполняется с помощью библиотеки Python Scikit-learn на наборе данных, который мы получили от Reddit. Наш окончательный набор данных значительно искажен и состоит из 91 539 пользователей и баз комментариев, из которых 852 определены голландскими пользователями, 90 687 не голландскими пользователями. Классовый дисбаланс — 1: 100. Мы используем настройки параметров, как описано в Разделе Связанные работы .Задача здесь состоит в том, чтобы классифицировать набор комментариев от конкретного пользователя как голландский (1) или не голландский (0), таким образом представляя задачу двоичной классификации.

Результаты

Результаты представлены в терминах ранее упомянутого f 1 балл, балл за точность и средний балл за точность. Более того, стратифицированная пятикратная перекрестная проверка выполняется без использования выбора признаков, выбора признаков по критерию хи-квадрат, а также выбора признаков частоты термина.

Важные особенности

Прежде всего, оба классификатора отслеживают важность характеристик с соответствующими коэффициентами модели. Если мы рассортируем эти особенности по их важности, мы получим интересное представление о различиях в словоупотреблении голландских и не голландских авторов. Некоторые из наиболее важных функций (функции с наивысшими коэффициентами) после запуска логистической регрессии — SVM показывает аналогичные результаты — включают термины, которые явно увеличивают шансы на то, что пользователь является голландцем.К ним относятся «Нидерланды», «голландский», «н-ли», «Голландия» и т. Д., А также некоторые голландские слова, которые, как и ожидалось, проскользнули через детектор языка. Вторая по важности функция относится к более интересной категории: это орфографические ошибки. Модель, похоже, обнаружила, что голландские пользователи допускают определенные орфографические ошибки, которые могут идентифицировать их как голландцев. К ним относятся орфографические ошибки «eachother» и «ofcourse» или «offcourse», которые на самом деле должны быть записаны как два слова «друг друга» и «конечно».«Корыто» — это еще одна опечатка или орфографическая ошибка, которую модель отмечает как важную, а также как «сфокусированную», которую следует «сфокусировать». Очевидно, мы получаем ограниченное представление о структуре предложений голландских авторов, потому что мы использовали только униграммовое представление собранных текстов.

показывает результаты в нашем наборе данных Reddit. Как уже упоминалось, использовались три показателя производительности: f 1 , точность и средний балл точности.

Таблица 1.

Результаты экспериментов с двумя моделями, логистической регрессией и линейной машиной опорных векторов (SVM) с различными методами выбора признаков.

9045 904 Top 9045 9045 9045 0,89 9048 0,833
Показатели эффективности Логистическая регрессия
Линейный SVM
Нет Chi2 Top 10k Top 100k 9045 Top
f 1 0,772 0,772 0,736 0,772 0,750 0,758 0.729 0,754
Прецизионность 0,827 0,840 0,741 0,846 0,797 0,803 0,690 0,808 0,690 0,808 0,690 0,808 9048 9048 9048 9048 9048 0,813 0,819 0,780 0,818

Для логистической регрессии мы находим, что f 1 баллов одинаковы для всех вариантов выбора методов (0.750). Из четырех настроек теста логистическая регрессия с максимальным набором функций 100 000 дает наилучшую производительность. Честно говоря, разница между использованием этого метода выбора признаков или выбора признаков хи-квадрат незначительна. Кривые точного отзыва обеих моделей показаны на. Рисунок показывает, что для 20% отзыва точность все еще составляет почти 100% с использованием моделей логистической регрессии. Это означает, что большинство документов / пользователей, которые модель оценила наверху, правильно распознаются как уроженцы Голландии.

Кривые точности / отзыва для машины линейного вектора поддержки и логистической регрессии. Кривые были построены путем вычисления точности и отзыва собранных выходных данных классификатора в оставшихся частях циклов перекрестной проверки. Площадь под кривыми точности / отзыва равна средней точности соответствующего классификатора.

В целом, мы отмечаем, что логистическая регрессия, учитывающая только 100 000 основных функций, дает лучшие результаты по каждому показателю производительности, хотя разница небольшая.

Результаты показывают, что логистическая регрессия дает лучшие результаты. Нас интересует не только то, какая модель работает лучше всего, но и то, как мы будем использовать эту модель, чтобы давать разумные рекомендации спецслужбам. Другими словами, нас может интересовать не только предсказание метки класса, но и какое-то значение, которое выражает уверенность в этом предсказании. Некоторые модели лучше дают оценки вероятностей классов, чем другие. Некоторым даже не хватает поддержки для любого вероятностного предсказания.К счастью, логистическая регрессия — это алгоритм, который имеет то преимущество, что возвращает вероятности, потому что он напрямую оптимизирует потерю журнала [47].

С нашей моделью логистической регрессии мы можем давать советы разведывательным службам несколькими способами, не упуская из виду некоторые важные моменты. Один из вариантов — просто позволить модели классифицировать пользователя, которого нам предоставляют спецслужбы. Мы собирали как можно больше комментариев от этого пользователя и передавали их нашей модели. Другой вариант — рекомендовать на основе вероятностей, которые предлагает модель логистической регрессии.Оба они предоставляют спецслужбам инструмент и в то же время раскрывают некоторые скрытые зацепки, которые мы искали в виде орфографических ошибок.

Заключение

Это исследование представило практический пример классификации текста: можем ли мы отличить голландских пользователей от не голландских пользователей на типичном английском онлайн-форуме? Мы показали, что с помощью популярных алгоритмов машинного обучения, таких как логистическая регрессия и вспомогательные векторные машины, можно без использования каких-либо метаданных провести различие между голландскими и не голландскими пользователями, которые оставляют комментарии на интернет-форуме.Несмотря на сложность сбора данных, мы поэкспериментировали с двумя моделями, которые хорошо работали с набором данных, который мы получили от Reddit, причем лучше всего работала регуляризованная логистическая регрессия L 2. Интересно, что модели нашли некоторые подсказки, которые мы искали. Было обнаружено, что важные особенности включают очевидные голландские слова, а также распространенные орфографические ошибки.

Понятно, что Reddit, хотя и является вполне репрезентативным для Интернет-форума, не обязательно может представлять собой форум, на котором преступники оставляют комментарии.Несмотря на использование выбора функций, трудно определить, насколько хорошо эта модель применима к другим форумам. Кроме того, не все форумы предлагают простой способ сбора информации. Маловероятно, что многие форумы предлагают аналогичный API, который предлагает Reddit. Однако это можно частично преодолеть, просто очистив веб-сайт с помощью множества широко доступных инструментов [48]. Трудно преодолеть тот факт, что некоторые форумы позволяют пользователям публиковать сообщения анонимно. Наша модель требует набора комментариев, потому что для того, чтобы сделать классификацию, требуются более длинные комментарии.Краткие комментарии гораздо труднее распознать с помощью предлагаемого метода. В конце концов, мы не можем собрать больше комментариев от одного и того же пользователя, если у него нет какого-либо имени или идентификатора.

Несмотря на то, что предложенный метод был описан для обнаружения голландских аборигенов на английском языке, его можно легко преобразовать для обнаружения других неанглийских аборигенов. Соответственно, можно сказать, что этот метод является общеприменимым.

Дальнейшие исследования должны быть направлены на выяснение, можно ли применить изученные модели к другим форумам с аналогичной эффективностью.Наконец, этот метод можно улучшить, например, включив биграммы и триграммы в качестве текстового представления.

Соответствие этическим стандартам

Эта статья не содержит исследований с участием людей или животных, выполненных кем-либо из авторов.

Заявление о раскрытии информации

Автор не сообщил о потенциальном конфликте интересов.

Ссылки

1. Грефенстетт Г. Сравнение двух схем языковой идентификации. Труды 3-й Международной конференции по статистическому анализу текстовых данных (JADT 95).Рим; 19951. с. 263–268. [Google Scholar] 2. Коппель М., Шлер Дж., Зигдон К. Определение родного языка автора путем поиска ошибок в тексте Материалы одиннадцатой Международной конференции ACM SIGKDD по открытию знаний в интеллектуальном анализе данных, KDD ’05. Нью-Йорк, Нью-Йорк: ACM; 2005. с. 624–628. [Google Scholar] 3. Тетро Дж. Р., Бланшар Д., Кэхилл А. Отчет о первой совместной задаче идентификации родного языка В: Тетро Джоэл Р., Бурштейн Джилл и Ликок Клаудиа, редакторы, BEA @ NAACL-HLT.Ванкувер: Ассоциация компьютерной лингвистики; 2013. с. 48–57. [Google Scholar] 4. Вайс GM. Майнинг с редкостью: объединяющая структура. SIGKDD Explor. 2004; 6: 7–19. [Google Scholar] 5. Брэдли А. Использование площади под кривой ROC при оценке алгоритмов машинного обучения. Распознавание образов. 1997; 30: 1145–1159. [Google Scholar] 6. Дэвис Дж, Гоадрич М. Взаимосвязь между точным воспроизведением и кривыми ROC ICML ’06: Материалы 23-й международной конференции по машинному обучению.Нью-Йорк, Нью-Йорк: ACM; 2006. с. 233–240. [Google Scholar] 7. Россо П. Профилирование авторов и выявление плагиата. Чам: издательство Springer International Publishing; 2015. с. 229–250. [Google Scholar] 8. Elayidom MS, Jose C, Puthussery A, et al. . Классификация текстов для анализа авторства. Adv Comput: Int J (ACIJ). 2013; 4: 1–10. [Google Scholar] 9. Виссе В., Винман К. ДНК сценариев: идентификация программиста JavaScript. Цифровые инвестиции. 2015; 15: 61–71. [Google Scholar] 10. Турни П.Д. Большие пальцы руки вверх или вниз? Семантическая ориентация применяется к неконтролируемой классификации обзоров.Труды 40-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL). Филадельфия. Springer (США); 2002. с. 417–424. [Google Scholar] 11. Ирани Д., Уэбб С., Пу К. Исследование тенденций в Twitter с помощью классификации текста. Седьмая ежегодная конференция CEAS по сотрудничеству, электронным сообщениям, борьбе с злоупотреблениями и спамом. Редмонд: ACM; 2010. с. 11. [Google Scholar] 12. Бинод Дж., Габриэла Р., Тамар С. Идентификация на родном языке: простой подход, основанный на n-граммах. Материалы восьмого семинара по инновационному использованию НЛП для создания образовательных приложений.Атланта: Ассоциация компьютерной лингвистики; 2013. с. 224–231. [Google Scholar] 13. Вонг С.-Майкл, Драс М. Использование структур синтаксического анализа для идентификации родного языка Труды конференции по эмпирическим методам обработки естественного языка, EMNLP ’11. Страудсбург, Пенсильвания: Ассоциация компьютерной лингвистики; 2011. с. 1600–1610. [Google Scholar] 14. Вонг SMJ, Драс М. Сравнительный анализ и определение родного языка. Труды семинара Австралазийской языковой ассоциации.Сидней: Австралазийская языковая ассоциация; 2009. с. 53. [Google Scholar] 15. TOEFL.US: ETS [цитируется 1 февраля 2018 г.]. Доступна с: 10.1080 / 01932691.2018.1479267 [CrossRef] 16. Себастьяни Ф. Машинное обучение в автоматизированной категоризации текста. ACM Comput Surv. 2002; 34: 1–47. [Google Scholar] 17. Форман Г. Обширное эмпирическое исследование показателей выбора функций для классификации текста. J Mach Learn Res. 2003; 3: 1289–1305. [Google Scholar] 18. Ли Т., Чжан Ц., Огихара М. Сравнительное исследование методов отбора признаков и многоклассовой классификации для классификации тканей на основе экспрессии генов.Биоинформатика. 2004. 20: 2429–2437. [PubMed] [Google Scholar] 19. Чжэн З., Ву Х, Шрихари Р. Выбор функций для категоризации текста по несбалансированным данным. Информационный бюллетень ACM SIGKDD Explor. 2004; 6: 80. [Google Scholar] 20. Иоахим Т. Категоризация текста с помощью векторных машин поддержки: обучение с множеством важных функций. Mach Learn. 1998; 1398: 137–142. [Google Scholar] 21. Тибширани Р. Регрессионная усадка и выбор с помощью LASSO. J R Stat Soc B. 1996; 58: 267–288. [Google Scholar] 22. Pedregosa F, Varoquaux G, Gramfort A и др.. Scikit-learn: машинное обучение на Python. J Mach Learn Res. 2011; 12: 2825–2830. [Google Scholar] 23. Нигам К., Маккаллум А. К., Трун С. Классификация текста из помеченных и немаркированных документов с помощью EM. Mach Learn. 2000; 39: 103–134. [Google Scholar] 24. Трстеняк Б., Микац С., Донко Д. KNN с фреймворком на основе TF-IDF для категоризации текста. Процедуры Eng. 2014; 69: 1356–1364. [Google Scholar] 25. Xu B, Guo X, Ye Y, et al. . Улучшенный классификатор случайного леса для категоризации текста. J Comput (Финляндия).2012; 7: 2913–2920. [Google Scholar] 26. Reddit Что нового на Reddit: Поздравляем нас с 10-летием! Празднование лучших результатов 10-летия Reddit; 2015. [Google Scholar] 29. Пота Н, Стамататос Э. Профильный метод проверки авторства. Чам: издательство Springer International Publishing; 2014. с. 313–326. [Google Scholar] 30. Шуйо Н. Библиотека определения языка для java; 2010. [Google Scholar] 31. Veenman CJ. Исследование базы данных как проблема ранжирования Труды Европейской конференции по разведке и информатике безопасности (EISIC), Оденсе, Дания, 21–24 августа, 2012 г.п. 225–231. [Google Scholar] 32. Маккаллум А., Нигам К. Сравнение моделей событий для классификации наивных байесовских текстов. AAAI / ICML-98 Практикум по обучению классификации текста. Менло-Парк: расположение AAAI; 1998. с. 41–48. [Google Scholar] 33. Русинол М, Лладос Дж. Выделение логотипа с помощью набора слов для категоризации документов. Труды Международной конференции по анализу и распознаванию документов, ICDAR. Барселона: IEEE; 2009. с. 111–115. [Google Scholar] 34. Скотт С., Мэтвин С.Классификация текста с использованием гиперонимов WordNet. Материалы семинара: Использование WordNet в системах обработки естественного языка. Ассоциация компьютерной лингвистики; 1998: 45–51. [Google Scholar] 35. Раджараман А., Ульман Дж. Д.. Data Mining In: Mining of Massive Datasets. Нью-Йорк: Местоположение издательства Кембриджского университета; 2011. с. 114–142. [Google Scholar] 36. Cavnar WB, Trenkle JM, Arbor Mi A. Категоризация текста на основе N-граммов. Материалы 3-го ежегодного симпозиума по анализу документов и поиску информации SDAIR-94.Лас-Вегас: Университет Невады; 1994. стр. 161–175. [Google Scholar] 37. Хьюз Г. О средней точности статистических распознавателей образов. IEEE Trans Inf Theory. 1968; 14: 55–63. [Google Scholar] 38. Инь С., Хуанг З., Чен Л. и др. . Подход к уменьшению размерности признаков классификации текста и генерации правил на приблизительном наборе. 3-я Международная конференция по инновационной вычислительной информации и управлению, 2008 г. ICICIC ’08. 2008. с. 554–554. [Google Scholar] 39. Хасти Т., Тибширани Р., Фридман Дж. Х.Элементы статистического обучения: интеллектуальный анализ данных, вывод и прогнозирование. Берлин: Springer; 2013. [Google Scholar] 40. Сингх С.Р., Мурти Х.А., Гонсалвес Т.А. Выбор признаков для классификации текста на основе коэффициента неравенства Джини. JMLR: Материалы семинара и конференции 10 Четвертый семинар по выбору функций в интеллектуальном анализе данных. Хайдарабад, Индия: MIT Press; 2010. с. 76–85. [Google Scholar] 41. Кокс DR. Регрессионный анализ бинарных последовательностей (с обсуждением). Дж. Рой Стат Соц Б.1958; 20: 215–242. [Google Scholar] 42. Джурафски Д., Мартин Дж. Х. Классификация: наивный Байес, логистическая регрессия, сантименты. В обработке речи и языка. Верхняя Седл-Ривер: Прентис-Холл; 2015. [Google Scholar] 43. Rong-En F, Kai-Wei C, Cho-Jui H, et al. . LIBLINEAR: библиотека для большой линейной классификации. J Mach Learn Res. 2008; 9: 1871–1874. [Google Scholar] 44. Кохави Р. Исследование перекрестной проверки и начальной загрузки для оценки точности и выбора модели Труды 14-й Международной совместной конференции по искусственному интеллекту — Том 2, IJCAI’95 Сан-Франциско, Калифорния: Морган Кауфманн Паблишерс Инк; 1995 г.п. 1137–1143. [Google Scholar] 45. Кент А. Спакман. Теория обнаружения сигналов: ценные инструменты для оценки индуктивного обучения Материалы Шестого международного семинара по машинному обучению. Сан-Франциско, Калифорния: Морган Кауфманн Паблишерс Инк; 1989. с. 160–163. [Google Scholar] 46. Фосетт Т. Введение в ROC-анализ. Pattern Recogn Lett. 2006. 27: 861–874. [Google Scholar] 47. Никулеску-Мизил А., Каруана Р. Предсказание хороших вероятностей с помощью контролируемого обучения Материалы 22-й Международной конференции по машинному обучению, ICML ’05.Нью-Йорк, Нью-Йорк: ACM; 2005. с. 625–632. [Google Scholar]

Могу ли я преподавать английский за границей (или онлайн), если я не являюсь носителем языка?

Примечание для читателей: мы улучшили этот блог, чтобы он отражал соответствующие отраслевые термины, касающиеся того, как мы обращаемся к людям, чей родной язык не английский. Термин «носители английского языка и лица, для которых английский не является родным» исторически ассоциировался с дискриминацией. В соответствии с мандатом службы международных школ , мы работаем над устранением этого языка и, что еще более важно, предполагаемой предвзятости, которую он предполагает.

Люди со всего мира всегда спрашивают нас: «Могу ли я преподавать английский за границей или онлайн, если я не носитель языка?»

Да, вы абсолютно можете преподавать английский за границей или преподавать английский онлайн, если вы не носитель языка!

Мы рады развенчать этот миф.

В Teach Away мы поддерживаем учителей со всего мира, включая людей, чей родной язык не английский, в большом количестве замечательных преподавательских вакансий за границей. Слишком много, чтобы сосчитать!

Самое приятное то, что спрос на учителей английского языка во всем мире сейчас стремительно растет.

Хотите знать, есть ли у вас все необходимое для обучения английскому языку?

Вы:

  1. Имеете степень бакалавра?
  2. Вы говорите по-английски на высоком уровне?
  3. У вас есть сертификат TEFL?
  4. Умеете учить?

Если вы отметите все эти четыре поля, вы готовы преподавать английский язык!

Где я могу преподавать английский как человек, чей родной язык не английский?

Где угодно! Для всех, кто интересуется преподаванием английского языка, будет идеальная работа преподавателя английского языка за границей или в Интернете.

Правильная возможность для вас больше связана с доступностью, например, в Китае, где много изучающих английский язык.

Не забывайте, английский — это глобальный язык, и во многих случаях наличие нескольких языков в вашем репертуаре действительно может дать вам преимущество перед конкурентами.

Почему? Что ж, просто подумайте, насколько вы можете вдохновить своих учеников как преподаватель английского языка как иностранного.

Как двуязычный учитель, вы можете многое предложить.

Во-первых, вы раньше были на месте своих учеников. Вы также много работали, чтобы выучить английский язык на высоком уровне, поэтому вы знаете, что такое выучить язык с нуля на собственном опыте.

Во-вторых, вы обладаете глубоким пониманием концепций грамматики английского языка, которого не будет у англичан как носителей первого языка, поскольку вы выучили язык интуитивно с рождения.

Помните, что отличные учителя английского языка — это ваше владение языком и ваша страсть к обучению других.

Дискриминации нет места в классе, и ваша национальность не должна рассматриваться как препятствие на пути к достижению вашей мечты.

Что такое «родная англоязычная страна»?

Несмотря на то, что происходят позитивные изменения, в некоторых странах по-прежнему есть работодатели, которые нанимают только кандидатов из стран, ранее называвшихся «носителями английского языка». В частности, США, Канада, Великобритания, Ирландия, Южная Африка, Австралия и Новая Зеландия.

Конечно, есть множество других стран, в которых английский является основным языком, например, Карибский бассейн, Филиппины и Индия, и это лишь некоторые из них.

На самом деле есть несколько стран, таких как ОАЭ, Южная Корея и Япония, которые по-прежнему имеют строгие визовые требования, а это означает, что кандидаты на обучение должны иметь паспорт одной из семи указанных выше стран.

Итак, где я могу преподавать за границей?

Не расстраивайтесь из-за вышеизложенного. Реальность такова, что эти препятствия меняются, и Teach Away вносит свой вклад, чтобы помочь школам устранить предвзятость при приеме на работу.

По-прежнему существует множество возможностей трудоустройства в популярных зарубежных учебных заведениях.

Список длинный: Таиланд, Камбоджа, страны Центральной и Южной Америки, такие как Мексика и Бразилия, страны Европы и Турция, среди прочего, все приветствуют заявки от всех, кто свободно говорит по-английски.

Как убедиться, что вы обладаете максимальной квалификацией для преподавания в этих странах?

Как повысить свои шансы быть нанятым преподавать английский язык за границей или онлайн.

Как и при поступлении на любую работу, покажите, что вы подходите для этой роли.

Важно заранее знать квалификацию.

Step 1

Перейдите на доску вакансий Teach Away и просмотрите несколько объявлений о вакансиях в странах, в которых вы хотели бы преподавать.

Это поможет вам выяснить любые пробелы в вашем резюме, которые могут стоить вам собеседование по преподаванию английского языка этой мечты.

Зарегистрируйтесь в Teach Away сегодня, чтобы получить доступ к


новейшим преподавательским вакансиям по всему миру.

Step 2

Убедитесь, что вы обладаете как можно более высокой квалификацией для интересующей вас работы преподавателя английского языка.

  • Пройдите курс TEFL, чтобы повысить свои шансы получить работу в одной из многих стран, которые приветствуют заявки от всех, кто свободно говорит по-английски.
  • Продолжайте улучшать свои знания английского языка. Читайте книги, слушайте английскую музыку и смотрите фильмы с отключенными субтитрами.

Все эти ежедневные занятия помогут вам освежить свои знания английского языка!

Так что подавайте заявку!

Не позволяйте своему двуязычию помешать вам осуществить свою мечту стать учителем английского языка за границей или в Интернете.Как мы уже говорили, это актив.

Вы можете быть преподавателем ESL в разных странах или в онлайн-обучающих компаниях.

Дайте ему лучший шанс — составьте резюме, выясните, где лучше всего преподавать за границей, и ищите подходящие возможности на нашей доске объявлений.

Удачи!

«Перспектива носителя английского языка»

По мере роста популярности английского как второго языка, 28-летняя Шастри Сукдео, корреспондент Содружества из Тринидада, ныне проживающая в Амстердаме, рассматривает влияние на стимулы для носителей английского языка к тому, чтобы они становились двуязычными.

Меня всегда поражало количество людей, которые изучали английский как второй язык. В районе Поплар в Восточном Лондоне, где я когда-то жил, довольно часто можно услышать, как говорят на сомали или бенгали, и увидеть вывески на рынке выходного дня, написанные на бенгальском языке. Но я никогда не сомневался, что людям, говорящим на других языках, будет сложно общаться на английском (иначе мои поездки на рынок были бы исследованием коммуникативных барьеров). Конечно, кажется очевидным, что в Лондоне все будут говорить по-английски.Если не говорить по-английски, найти работу было бы практически невозможно. Тот факт, что все говорят по-английски, считается само собой разумеющимся.

В Амстердаме, где я сейчас живу, люди принимают тот факт, что английский можно использовать как данность, несмотря на то, что там нет официальных статуй. Почти все голландцы свободно владеют английским языком на очень высоком уровне. Однажды я видел, как мой голландский коллега читал «Война и мир» в английском переводе. Когда я спросил, почему он решил читать по-английски, он ответил, что начал читать романы только для уроков английского языка и продолжает читать по-английски.Уровень владения моим родным языком людьми, не говорящими по-английски, иногда может быть пугающе впечатляющим.

Процент англоговорящих растет во всем мире, как и процент двуязычных. Эти цифры роста связаны между собой, поскольку это означает, что многие люди изучают английский как второй язык. Но, похоже, из этого также вытекает, по крайней мере, из того, что я узнал, разговаривая с другими носителями языка, так это то, что им не нужно беспокоиться об изучении каких-либо других языков.

Это правда, на первый взгляд. Зачем кому-то нужно изучать другой язык, если все изучают английский? Им не нужно , чтобы . И это, вероятно, главное различие между носителями английского языка и теми, кто изучает английский как второй язык: потребность и спрос на английский. Почти каждый носитель английского языка знает кого-то, кто пытался выучить второй язык, но не смог. Эти люди обычно намного превосходят носителей английского языка, которые успешно овладели навыками (не говоря уже о беглости) на другом языке, потому что они могут отказаться, когда язык становится трудным.

Нет корреляции между изучением второго языка носителями английского языка и социальной мобильностью, как это обычно бывает у людей, изучающих английский язык. Лондон полон испанских и португальских граждан, которые работают здесь из-за туманных перспектив найти работу в этих странах в настоящее время. Тема языков всегда поднимается на общественных мероприятиях в офисе, и одна из наиболее часто приводимых причин, по которой английский выучили, — это возможность.

Для носителей английского языка изучение второго языка — это хобби, и, как и многие другие хобби, им следят без энтузиазма.Мне потребовалось несколько лет, чтобы приблизиться к знанию любого иностранного языка, факт, который я изначально приписывал неспособности изучать иностранные языки. Но, к сожалению, правда намного проще. Было слишком легко вернуться на английский, на котором говорили почти все. Я полагаю, что в такой ситуации оказываются многие англоговорящие.

Выучить английский язык не так-то просто, несмотря на обилие англоговорящих. Люди достигают знания английского языка путем погружения. Английские СМИ повсюду, и, конечно же, без них возможности ограничены.Люди говорят, что китайский язык — это язык будущего, но английский — это язык настоящего. Но для носителей английского языка мы не можем гарантировать, что всегда будем лениться, выбирая другие языки. Вполне возможно, что незнание другого сильно ограничит нас даже больше, чем сейчас. Кроме того, разве не было бы здорово знать, что люди говорят, когда думают, что нет?

кредит на фотографию: pilllpat (agence eureka) alphabete p17 via photopin (лицензия)

…………………………………………………………………………………………………………………
Обо мне: Я сейчас работать операционным аналитиком с упором на цепочку поставок.Мои интересы — спорт, иностранные языки, путешествия и кулинария. Мои исследования в области финансов также увлекли меня валютными рынками и международной торговлей.
Я стремлюсь к тому, чтобы иметь возможность много путешествовать и пытаться задокументировать и описать тонкости множества разнообразных спортивных и кулинарных культур по всему миру.
…………………………………………………………………………………………………………………
Мнения, выраженные в этой статье принадлежат автору и не обязательно отражают точку зрения Молодежной программы Содружества.Статьи публикуются в духе диалога, уважения и понимания. Если вы не согласны, почему бы не отправить ответ?
Чтобы узнать больше о том, как стать корреспондентом Содружества, посетите: http://www.yourcommonwealth.org/submit-articles/
…………………………………………………………… ……………………………………………………

Комментарии

комментария

Powered by Facebook Комментарии

Можете ли вы звучать как носитель языка?

2 мая 2012 г.

Привет, Стив Кауфманн снова здесь.Пришло время снять видео. Я разместил несколько интервью с такими людьми, как Лука, Моисей, Ричард и Феликс. Очень часто люди говорят сделать что-нибудь на том или ином языке или просят субтитры. Что касается субтитров, у меня просто нет времени на их выполнение, поэтому субтитров не будет. Если у вас есть конкретные запросы, возможно, люди смогут проголосовать за них, на каком языке они хотят слышать, с кем они хотят, чтобы я разговаривал. Люди также предлагают мне поговорить с профессором Аргуэльесом, и я попытаюсь это сделать.Может быть, кто-нибудь поможет мне там установить связь.

Так что, если они популярны, я продолжу их делать. Я считаю, что они великолепны, потому что до YouTube мы понятия не имели, что существует так много людей, говорящих на стольких разных языках. Я уверен, что те немногие люди, с которыми я разговаривал, — это лишь верхушка айсберга, их гораздо больше. Как я уже говорил ранее, как только вы откажетесь от второго и третьего языков, каждый последующий язык станет легче выполнять со многих точек зрения, и это является предметом моего обсуждения сегодня, включая аспект произношения.

Я, конечно, усерднее работал над тем, чтобы мое произношение было как можно ближе к родному, скажем, на французском, а затем на китайском, чем я делал это на последующих языках, потому что я думаю, что мозг становится более комфортно и привыкает к различным звукам, к более широкому диапазону звуков. . Чем больше языков мы изучаем, тем больше контроль над тем, что первые языковые упражнения в вашем мозгу становятся слабее, поскольку вы подвергаетесь воздействию все большего разнообразия звуков и даже структур и так далее, и так далее.Теперь вопрос в том, насколько это реально, и разумно ли попытаться звучать как носитель языка?

Как я часто говорил, изучение языка — это получение удовольствия. Так что, если вам нравится пытаться звучать как носитель языка, во что бы то ни стало, сделайте это, но я думаю об идее попытаться звучать как носитель языка на двух уровнях. Если это ваша цель, другими словами, это модель, например, я хотел бы размахивать клюшкой для гольфа, такой как Тайгер Вудс, — это нормально. Если вы на самом деле рассчитываете походить на туземца или собираетесь ударить по мячу, как Тайгер Вудс, я думаю, что это нереально, и я думаю, что это отвлекает.

Кроме людей, которые растут двуязычными, по крайней мере, с подросткового возраста, если не с раннего детства, я не могу вспомнить многих людей, с которыми я разговариваю по-английски, которые звучат как родные. Был один парень, которого я слушал на Antimoon несколько лет назад, и я подумал, что у него действительно хороший американский акцент. На нашем форуме в LingQ был парень из Санкт-Петербурга, чей английский был очень близок к родному. Вы должны внимательно слушать, но неизбежно что-то выдаст их.Возможно, если я позвоню в японский ресторан, французский ресторан или китайский ресторан и попрошу столик, а на заднем плане будет звенеть много блюд, собеседник на другом конце телефона может подумать, что я местный. или даже не буду задавать себе этот вопрос, но если я заговорю с кем-то, они узнают, что я не коренной.

Лука, который звучит для меня как носитель немецкого, французского и испанского языков, не звучит для меня как носитель английского языка.Это потому, что он лучше говорит на других языках? Единственная реальная проверка того, звучите ли вы как носитель языка, — это то, думает ли носитель, что вы говорите как носитель языка. Как я уже сказал, я редко кого слышу. Получается странный очень двуязычный человек, особенно в Квебеке. Люди выросли в окружении английского языка. Тренер нашей профессиональной хоккейной команды в Ванкувере ________, я имею в виду, что он звучит для меня примерно как местный. Вы можете выделить несколько вещей, которые немного отличаются. По сути, он звучит как родной, но он уже давно живет на английском.Мысль о том, что вы можете говорить как носитель нескольких языков, я думаю, маловероятна. Это еще и отвлечение, потому что, в конечном счете, это не имеет значения.

На днях кто-то разместил на нашем форуме в LingQ ссылку на некоего г-на Вона, который руководит языковыми школами в Испании, и я разместил ссылку в своем блоге. Он безупречно говорит по-испански. Я имею в виду, что он отлично говорит. Я просто трепетал перед его испанским языком, но могу сказать, что он не коренной, и я знаю, что испанцы могут сказать, что он не родной, и это не имеет значения.Это никоим образом не умаляет его испанского. Я имею в виду, что Генри Киссинджер говорил с явным акцентом, но очень хорошо использовал язык. Так что для меня, говоря как местный житель (А), маловероятно, что вы добьетесь этого. Приятно иметь модель, ты знаешь, что тянешься к небу, но маловероятно, что ты достигнешь этого. На мой взгляд, гораздо важнее хорошо владеть языком.

Если вы пойдете и поговорите с кем-то, и в первые пять секунд он подумает, что вы коренной, мы не будем использовать этот язык только для общения в пятисекундных пунктах.Мы хотим настоящего обмена. Честно говоря, если я общаюсь с кем-то на этом языке, меня не волнует, считает ли он меня родным. Я хочу хорошо поговорить с этим человеком, поэтому впечатление, которое я создаю в первые пять секунд разговора, для меня не имеет значения. Для меня не имеет значения, считает ли кто-то в ресторане с достаточным фоновым шумом, что я являюсь носителем японского языка. На самом деле это не имеет значения, когда я с японцами, я просто хочу общаться.

Другое дело, что изучение языка в значительной степени связано с открытием языка, знакомством с культурой, изучением страны, изучением истории, обучением пониманию языка. Это очень важно при изучении языка. Язык — это не спорт, в котором нас оценивают по тому, насколько хорошо было погружение в прыжках в воду или в фигурном катании. Это не то. Это понимание, открытие, изучение и общение. Если только у вас такой плохой акцент, что носитель языка не может вас понять, пытаясь подражать … Как я говорю, да, это образец, но мы не ожидаем его достичь.

Итак, мы все хотели бы в какой-то степени улучшить наш акцент, так что мы можем сделать? Некоторые говорят, что тебе нужно петь, если ты любишь петь, пой. Лично я этого не делаю, но, очевидно, в этом нет ничего плохого. Одна вещь, которую я нашел полезной, — это слушать, а затем записывать себя, а затем сравнивать, сначала со словами, затем с фразами, а затем с абзацами и уделяя много внимания интонации. Как отмечают многие, очень важна интонация. Есть слово «просодия» или что-то в этом роде, я не использую его, потому что не люблю странные слова, с которыми никогда раньше не сталкивался.Мне отлично подходит интонация, ритм, музыка, интонация, текучесть языка. Я думаю, что нам может помочь частое прослушивание, запись и сравнение, равно как и длительное прослушивание.

Я сделал здесь несколько заметок. Я тренировался, слушая чешский, но все же думал об этом. Затем я выходил с беговой дорожки, делал заметки и возвращался на беговую дорожку, пока чешский подкаст расплывался на заднем плане. Что еще я здесь сказал? Изучение языка — это скорее целостная вещь.Это слушание, чтение, открытие, говорение, работа над словарным запасом. Он работает над множеством вещей, включая интонацию и ритм. Чем больше этих частей начинает складываться, тем лучше вы говорите на языке и, вероятно, тем лучше станет ваш акцент. У одних людей лучше, чем у других, получается акцент, но попытки сознательно звучать как родной или утверждать, что вы говорите как родной для меня, как я говорю, — это просто отвлечение от изучения языка.

Что еще я хотел сказать? Главное, чтобы люди со мной общались. Я хочу уметь достаточно хорошо говорить с точки зрения моего акцента и использования языка, но носитель языка не делает никаких особых скидок. Носитель языка не говорит, что я разговариваю с каким-то иностранцем, которому трудно выразить себя, и я не могу понять, что он говорит. Я хочу, чтобы носитель языка просто сказал, что это Стив Х. Мы общаемся независимо от его национальности или языка происхождения.Ему есть что сказать, что интересно, и он может выразить себя, или то, что он говорит, глупо, и я собираюсь сказать ему, что он глуп. Так или иначе, мы общаемся.

То есть, в основном, вот оно. Ричард и я оба очень хорошо говорим по-французски, Ричард Симкотт, как и Лука. Уверена, они оба лучше меня. Я не могу говорить за Луку, его могут принять за туземца, не знаю. Не думаю, что нас с Ричардом сочтут носителями нашего французского языка, но мы оба очень хорошо говорим на этом языке, и я думаю, что это все, что вам нужно достичь.

Так что спасибо за внимание, пока пока.

Gotham Gazette — Гражданин

А Родной писатель, жаждущий пиццы, бублика и суши

Чанг-Рэ Ли родился в Сеуле, Корея в 1965 году. пригород Нью-Йорка в трехлетнем возрасте. В 1995 году он написал свой первый роман «Носитель языка» об американце корейского происхождения, который также шпион, и попытка персонажа достать товар коррумпированный американец корейского происхождения, член городского совета из Квинса.Когда он был опубликован, он получил почтительное внимание в литературных кругах. но в этом году он получил широкую огласку благодаря докладу, это был один из двух финалистов, выбранных группой из 15 библиотекарей, учителя и владельцы книжных магазинов, которые хотели продвигать своего рода общегородские книжный клуб. Их идея, вдохновленная аналогичными усилиями в таких городах, как В Сиэтле и Чикаго по одной книге должны были прочитать все жители Нью-Йорка.

Группа раскололась; идея развалилась. До того, как это случилось, Ли, который начнет преподавать творческое письмо в Принстоне в осенью, выступил в прошлом месяце на книжной выставке на съезде Джейкоба Джавитса. Центр. Вот выдержка:

Потому что я здесь с такими замечательными писателями и такими замечательными Нью-йоркские писатели — писатели, которые действительно придают мне форму тому, что это значит быть жителем Нью-Йорка — я думал, что прочитал несколько страницы из «Носителя языка», моего первого романа, вышедшего вышел в 95-м.Я думаю, что одна из причин, по которой я здесь сегодня, ходят слухи, что Нью-Йорк будет читать «Носитель языка» в рамках промо-акции «Одна книга, один город» этой осенью.

Выбором остался вполне доволен, хотя немного ужаснулся судя по всей реакции на книгу. Но в любом случае для меня большая честь Я написал эту книгу в Орегоне, когда учился в аспирантуре. там. И я должен сказать, что для меня эта книга действительно для меня … о иммигранты и язык, идентичность и ассимиляция.Часть этого было просто моим любовным письмом в Нью-Йорк, потому что я скучал по Нью-Йорку Йорк так много. Я был в Юджине, штат Орегон, и жил в этом действительно затхлом районе. маленькая хижина и не могу достать пиццу, бублик и суши — и просто подумал: «Черт возьми, какого черта я здесь делаю?»

И я подумал: «Ну, я пишу эту книгу, очевидно, действие происходит в Нью-Йорке, но часть моего удивления по поводу эта книга до сих пор выглядит странной о нью-йоркских и опыт этого.

На самом деле я не коренной житель Нью-Йорка. Мы жили на манхэттене ненадолго, но я всегда жил на улице. я жил в Вестчестер. Я сейчас живу в Нью-Джерси. Я, наверное, собираюсь двигаться дальше по побережью в сторону Принстона. Итак, я всегда был жителем Нью-Йорка по прибытии. Я всегда кто-то видеть город снаружи, всегда приходить и уходить. Например, сегодня я приехал на машине, и если вы приедете из туннеля Линкольна это самый сказочный вид.Я делаю это, когда приезжаю на работу. я не перестаю удивляться этому, и я буду в автобусе со всеми этими людьми в 9 часов утра. И водитель автобуса, вероятно, видел этот вид, спускающийся с рампы туннеля Линкольна восемь, девять, десять тысяч раз. Но каждый время от времени он просто останавливается и говорит, особенно на в такой день он скажет: «Посмотри на это!» И все будут посмотрите на это и оцените это.

В чем-то я почти рад, что не был таким Житель Нью-Йорка … В некотором смысле я всегда как бы хочу быть чужаком. Это довольно увлекательно. Я думал, что просто прочитал несколько страниц из этой старой книги. Этот небольшой раздел посвящен отец рассказчика, бакалейщик из Нью-Йорка.

«Для него мир — и под этим я должен иметь в виду эту самую землю, его выбранная нация — действовала по определенному набору процедур, определенных Правила участия.Это были неотъемлемые права иммигранта.

«Я должен был унаследовать их, наследие разворачивалось передо мной, это Кстати: вы работали от рассвета до глубокой ночи. Ты был никогда не был недобрым в ваших отношениях, но тогда вы не были щедрыми. Ваш семья была вашей жизнью, хотя вы их редко видели. Вы держались близко солидные суммы наличных денег мелкими купюрами. Вы были стабильно завоевывая рынок в гордости.Вы водили Chevy, а затем Кэдди, а затем Бенц. Вы никогда не пропустили ипотечный платеж или день церкви. Вы яростно молились, пока не заплакали. Вы считали единственными невидимыми силами должны быть силы капитализма и любви к Иисусу Христос «

Вернуться на страницу «Гражданин» !

Три причины, по которым вы должны любить свой родной язык

В 1999 году ЮНЕСКО провозгласила 21 февраля Международным днем ​​родного языка, чтобы способствовать культурному разнообразию и многоязычию во всем мире.Поскольку все больше и больше граждан мира становятся двуязычными или многоязычными, исследования в раннем детстве показывают, что многие иммигранты постепенно теряют знание родного языка, в то время как они лингвистически ассимилируются в англоязычных обществах.

Однако сохранение вашего родного языкового уровня имеет значение по многим личным, социальным, интеллектуальным, образовательным и экономическим причинам.

1. Для укрепления вашей культурной самобытности и семейных связей

Сохранение родного языка имеет решающее значение для вашей идентичности и способствует формированию позитивной самооценки. Ассоциация исследований межкультурного развития (IDRA) повторяет, что продолжение изучения родного языка после детства помогает вам научиться ценить свою культуру и наследие. Для родителей сохранение родного языка дома учит детей гордиться своей культурой и корнями.

Говоря на вашем родном языке с точки зрения социального взаимодействия, он может укрепить связи с членами семьи. Если не поддерживать родной язык, важные связи с членами семьи могут быть потеряны.Родители маленьких детей должны поощрять использование своего первого языка, чтобы подготовить ребенка к общению с их родным языком.

Исследователи отмечают, что, когда родители не могут хорошо общаться со своими детьми, они не могут легко передать им свои ценности, убеждения или советы о том, как справиться со своим опытом. Четкое общение помогает родителям делиться своей мудростью с детьми и дает им возможность стать такими мужчинами и женщинами, какими они хотят быть. Когда родители не могут общаться и влиять на своих детей из-за языковых барьеров, семьи могут потерять близость, которая возникает из-за общих убеждений и взаимопонимания.

Знание языков также помогает иммигрантам сохранять культурные и языковые связи с их родной страной, а свободное владение другим языком помогает иностранцам легче адаптироваться к новым культурам.

2. Чтобы овладеть другими языками

Изучающим язык необходимо постоянное интеллектуальное развитие. Когда молодые ученики, которые еще не владеют английским языком, говорят только на английском, они функционируют на более низком интеллектуальном уровне. Однако когда родители и дети общаются друг с другом на языке, который они знают лучше всего, они работают на своем фактическом уровне интеллектуальной зрелости.

Согласно журналу Multilingual Living, владение родным языком доказало свою пользу при изучении второго языка, и дети с сильными навыками первого языка более готовы и способны выучить второй язык. На ранних стадиях чтение на первом языке может значительно ускорить развитие навыков чтения на втором языке. В идеале, фундамент первого языка должен быть прочным до того, как будет изучен второй.

3. Чтобы расширить свой кругозор

Гражданам мира или мигрантам, которые планируют вернуться в свою родную страну в будущем, доступны лучшие возможности трудоустройства, если вы по-прежнему свободно говорите на своем родном языке.Также будет проще общаться и иметь дело с местными коллегами и клиентами.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *