Разное

Исправления орфографии: LanguageTool — Проверка грамматики и стилистики

23.03.2000

Содержание

Разработка веб-сервиса коллективного исправления орфографических ошибок на интернет-страницах


Please use this identifier to cite or link to this item: http://earchive.tpu.ru/handle/11683/41134

Title: Разработка веб-сервиса коллективного исправления орфографических ошибок на интернет-страницах
Authors: Федорова, Любовь Андреевна
metadata.dc.contributor.advisor: Шестаков, Николай Александрович
Keywords: орфография; ошибки; веб-сервисы; грамотность; автоматическое исправление; orthography; mistakes; web-service; literacy; automatic correction
Issue Date: 2017
Citation: Федорова Л. А. Разработка веб-сервиса коллективного исправления орфографических ошибок на интернет-страницах : бакалаврская работа / Л. А. Федорова ; Национальный исследовательский Томский политехнический университет (ТПУ), Институт кибернетики (ИК), Кафедра информационных систем и технологий (ИСТ) ; науч. рук. Н. А. Шестаков. — Томск, 2017.
Abstract: Объектом исследования является системы проверки орфографии и исправления ошибок в текстах, размещенных в сети Интернет. Цель работы – разработка веб-сервиса, предоставляющего возможность отображения коллективных исправлений орфографических ошибок на интернет-страницах, а также возможность предложения своих исправлений. В процессе исследования проводились анализ предметной области, проектирование и разработка обозначенного веб-сервиса. В результате исследования был разработан веб-сервис, предоставляющий пользователями сети Интернет возможность добавления своих исправлений в базу данных и отображения интернет-страниц в наиболее корректном виде, на основе имеющихся в базе данных предложенных исправлений.
The object of research is system spell-checking and correcting errors in the texts posted on the Internet. Goal – to develop a web service that provides the ability to display collective corrections of spelling errors on web pages, as well as the possibility of offering their corrections. In the process of investigation the domain analysis, design and development of a designated web service. The study was designed by a web service, providing Internet users the ability to add their fixes to the database and display the web pages in the most correct form, based on the available database, the proposed corrections.
URI: http://earchive.tpu.ru/handle/11683/41134
Appears in Collections:Выпускные квалификационные работы (ВКР)

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Исправить проверку орфографии Firefox, которая не работает

Проверка орфографии Firefox может быть мощным инструментом для пользователей, которые регулярно пишут в Интернете, но особенно для пользователей, которые пишут профессионально или хотят убедиться, что они не упускают из виду опечатки.

Это помогает запустить средство проверки правописания в фоновом режиме, чтобы проверить очевидные орфографические ошибки, чтобы их можно было избежать.

Может случиться так, что проверка орфографии Firefox работает некорректно.

Первое, что нужно сделать пользователям Firefox в этом случае, — это проверить, включена ли проверка орфографии в веб-браузере. Это можно сделать, перейдя в Инструменты> Параметры> Дополнительно. В более новых версиях браузера Firefox необходимо сначала нажать клавишу Alt, чтобы отобразить строку меню, прежде чем вы сможете перейти к расширенным настройкам в параметрах.

В Проверяйте орфографию при вводе текста необходимо установить флажок, чтобы проверка орфографии работала в браузере. Если это не так, проверьте его, и вполне вероятно, что это было причиной того, что Firefox не отображал вам никаких исправлений, пока вы использовали браузер.

Может случиться так, что проверка орфографии все еще не работает, даже если эта опция включена в настройках. Обычно это вызвано отсутствием файла словаря.

Чтобы проверить, так ли это, сделайте следующее:

  1. Щелкните правой кнопкой мыши веб-форму на любой веб-странице.
  2. Обратите особое внимание на отображаемые параметры.
  3. Если вы видите «Добавить словари», у вас нет установленных словарей, и вы должны это сделать. Обычно это происходит, если проверка орфографии не работает и если эта опция включена в настройках.

Firefox откроет новое окно, в котором отображаются доступные словари для веб-браузера. Все эти словари устанавливаются как надстройки к веб-браузеру. После установки словаря проверка орфографии должна работать.

Также можно сделать следующее, чтобы установить словари прямо в браузере. Визит Словари и языковой пакет Firefox и нажмите «Установить словарь» рядом с языком, для которого нужно включить проверку орфографии.

Если вы установили несколько словарей, переключаться между ними необходимо следующим образом:

  • Щелкните правой кнопкой мыши форму на веб-сайте.
  • Выберите «Языки»> язык, который вы хотите использовать для проверки орфографии.

Если вы хотите автоматизировать процесс, используйте Дополнение Dictionary Switcher для этого, поскольку он добавляет функциональность в Firefox.

Символ астериск как средство исправления орфографических ошибок — Соцсети на vc.ru

Развитие Интернета дало нам много возможностей: общаться, переписываться с людьми в мессенджерах, смотреть видеоролики из Интернета. Но нередко пользователи допускают орфографическую ошибку, неверное высказывание при печати и отправке текста собеседнику по разным причинам: быстрая печать текста на клавиатуре, спешка и тому подобное. И не везде есть возможность отредактировать отправленное собеседнику сообщение и тем более посты в соцсетях. В таких ситуациях выручает символ астериск (*) (в разговорной речи «звёздочка»), который ставят для того, что исправить ошибку в предыдущем сообщении, отправленном собеседнику.

В последние годы с развитием соцсетей и мессенджеров символ астериск получил широкое распространение во всём мире как средство исправления ошибок в отправленных сообщениях. Значительную роль в этом сыграла невозможность отредактировать отправленное собеседнику сообщение во многих популярных мессенджерах.

В то же время видеоблогеры во многих странах мира переняли этот метод, добавляя на экране текст со звёздочкой, чтобы объяснить зрителям, что на самом деле автор видео имел в виду. Видеоблогеры зачастую во время записи своих видеороликов допускают оговорки, ошибку, неверное высказывание и это выясняется только во время монтажа видео. К тому же, добавить текст со «звёздочкой» на экран при монтаже видео гораздо проще, чем перезаписывать весь сегмент видео — это ещё экономия времени и ресурсов.

В общем, использование «звёздочки» в данном случае как раз означает, что это исправление.

Как исправить остановку / неработающую проверку орфографии в Google Документах

При составлении или написании текстового документа в Документах Google мы иногда можем упускать из виду слова с орфографическими ошибками и основные грамматические ошибки. Благодаря инструменту проверки орфографии он автоматически сканирует и проверяет слова на предмет орфографических ошибок, чтобы вы могли исправить их перед окончательным черновиком.

Однако некоторые пользователи жаловались, что их инструмент проверки орфографии в Документах Google не работает должным образом или не подчеркивает орфографические ошибки. Они видят неправильное написание слов, но не видят никаких признаков проверки орфографии. В конечном итоге вы отправите или используете документ с ошибками в написании.

Некоторые методы исправят ошибку и восстановят ваш инструмент проверки орфографии в документах Google Docs. Просто продолжайте читать ниже, чтобы узнать об этих решениях и о том, как их применить для устранения проблемы.

Снимок экрана: Windows Dispatch

Исправьте проверку орфографии в Документах Google, не подчеркивая орфографические ошибки или слова с орфографическими ошибками

Вы можете использовать каждый из приведенных ниже методов, чтобы проверить и устранить проблему с проверкой орфографии, а также исправить ошибку. Если нет, выполните следующие действия, пока не решите проблему окончательно.

Решение №1 — перезапустите веб-браузер.

Быстрый перезапуск используемого вами веб-браузера поможет обновить инструменты и функции в Документах Google. Если не помогло, переходите к следующему решению.

Решение №2 — проверьте, активировали ли вы инструмент проверки орфографии.

Снимок экрана: Windows Dispatch

Возможно, вы случайно отключили инструмент проверки орфографии в настройках Документов Google. Дважды проверьте и включите функцию при необходимости.

  • Откройте документ, который вы хотите отредактировать, в Google Docs.
  • Щелкните вкладку Инструменты.
  • Перейти к орфографии и грамматике.
  • Посмотрите, есть ли флажки у параметров «Показать варианты написания» и «Показать предложения по грамматике».

Решение № 3 — Установите язык Документов Google для использования

Снимок экрана: Windows Dispatch

Средство проверки орфографии может с трудом определять слова с ошибками, если используемый по умолчанию язык не установлен должным образом. Для этого выполните следующие действия:

  • Перейдите на вкладку Файл в меню Документов Google.
  • Выбрать язык.
  • Теперь выберите язык, который вы хотите установить для своего документа.
  • Вы можете проверить, работает ли инструмент проверки орфографии.

Решение №4 — Удалите другие языки в вашем браузере.

  • В браузере нажмите кнопку «Еще».
  • Перейти к настройкам.
  • Щелкните Advanced.
  • Найдите параметр «Использовать проверку орфографии».
  • Отключите другие языки, которые вы не хотите использовать.

Решение №5 — Отключите инструмент проверки орфографии в вашем браузере.

  • В вашем браузере перейдите в меню настроек.
  • Выберите Advanced.
  • Щелкните «Языки».
  • Найдите раздел «Проверка орфографии».
  • Нажмите кнопку «Основная проверка орфографии» и снимите флажок «Расширенная проверка орфографии».
  • Перезагрузите ваш браузер.

Решение № 6 — Очистите кеш и данные вашего браузера.

  • В браузере перейдите к параметру «Дополнительно» или к меню.
  • Щелкните История.
  • Перейдите к Очистить данные просмотров.
  • Установите временной диапазон на Все время.
  • Обязательно установите флажки рядом с данными просмотра, кешем и файлами cookie.
  • Нажмите Очистить данные.

Решение № 7 — Скопируйте и вставьте в другой документ

  • В свой документ скопируйте весь текст.
  • Откройте новый документ в Google Документах.
  • Теперь вставьте текст и проверьте, работает ли инструмент проверки орфографии.

Решение №8 — Обновите свой браузер

Снимок экрана: Windows Dispatch
  • Зайдите в меню настроек вашего браузера.
  • Перейдите к О себе.
  • Теперь проверьте, доступны ли обновления.
  • Обновите ваш браузер.

Есть ли у вас другие решения, которые могут помочь в устранении неполадок и исправлении ошибки проверки орфографии в Документах Google? Мы хотели бы узнать больше. Вы можете рассказать нам об этом ниже.

Как включить функцию исправления грамматических ошибок. Проверка орфографии в Word

Пользуясь настолько мощным текстовым процессором, глупо обращаться к словарю для правильного написания спорных слов и словосочетаний. Пусть Word делает эту неблагодарную работу! Но на откровенные провокации редактор никак не реагирует и делает вид, что наша писанина – образец грамотности русского языка. Понимая, что это невозможно, мы задаемся вопросом: как включить проверку орфографии в Microsoft Word? Ответ располагается ниже.

Автоматическая проверка правописания

Для включения данной функции необходимо нажать «Файл» – «Параметры» – «Правописание». В появившемся окне отметьте нужные поля галочкой и нажмите кнопку «Сохранить».

Внимание! Если для набора русских слов используется другая кириллическая раскладка клавиатуры (украинская или белорусская), весь набранный текст может быть подчеркнут ошибкой. Будьте осмотрительны!

Добавление неизвестных слов

Чтоб добавить подобные слова в программный словарь и исключить его подчеркивание в будущем, нужно выделить его (или словосочетание), нажать ПКМ и в контекстном меню выбрать «Добавить в словарь». При нажатии на вариант «Пропустить», данная лексическая конструкция больше не будет подсвечиваться в этом документе.

Внимание! Все рассмотренные способы включения орфографии работают в версиях, начиная с Microsoft Word 2007 и новее.

Включение модулей проверки орфографии

Если по каким-то причинам при проверке орфографии появляется уведомление с текстом «Проверка правописания завершена» или «Средства проверки орфографии для языка не установлены» нужно выполнить следующие действия:

  1. Войдите в «Этот компьютер» – «Удаление и изменение программы».

  2. В списке приложений найдите Microsoft Office, кликните на него и нажмите кнопку «Изменить».

  3. В появившемся окне выберите «Добавить или удалить компоненты» и кликните «Продолжить».

  4. Перейдите по пути «Общие средства Office» – «Средства проверки правописания» – «Средства проверки правописания для русского языка» – «Проверка орфографии и грамматики». Нажав на кнопку (как показано на скриншоте) и вызвав контекстное меню, выберите «Запускать с моего компьютера».

    Включение проверки орфографии для выбранного языка

    В случае набора текста на других языках проверка орфографии может не работать. Для её включения нужно:


    Теперь вы можете быть уверены на 90% в грамотности вашего текста. Но узнав, как включить проверку орфографии в Word, не забывайте следить за неологизмами и теми словами, которые отсутствуют в базе редактора или имеют несколько значений.

Для включения проверки правописания в Microsoft Office откройте программный продукт Word, воспользовавшись ярлыком на рабочем столе или пунктом меню «Пуск» — «Все программы» — Microsoft Office – Microsoft Word. Кликните на вкладке «Файл» (Microsoft Office 2013) или нажмите на кнопку Office (Microsoft Office версии 2010 и 2007). Перейдите в раздел «Параметры» и нажмите на пункте «Правописание». Выберите меню «Исключения» и щелкните поле «Имя текущего файла». После этого снимите флажок со строчки «Скрыть ошибки правописания» и «Скрыть грамматические ошибки».

Если вы хотите включить автоматическую проверку правописания для всех документов, которые вы открываете Microsoft Office, в секции «Исключения» поставьте опцию «Все новые документы». Снимите соответствующие флажки «Скрыть» и сохраните произведенные изменения, нажав на кнопку «Ок».

В программе PowerPoint включение автоматической проверки правописания можно выполнить из аналогичного меню «Параметры» — «Правописание». Снимите флажок с пункта «Скрывать орфографические ошибки» и сохраните произведенные изменения.

Механизм работы

При возникновении ошибки в тексте Word подчеркнет ее красной, синей или зеленой линией. Красная линия используется для фиксирования орфографических ошибок. Недочеты в пунктуации указываются при помощи синей линии, а грамматические ошибки выделяются зеленой волнистой линией. Чтобы просмотреть возможные варианты написания и исправления ошибки, кликните правой клавишей мыши на слове или фразе.

Если вы принимаете предложенный Word вариант, выберите его, нажав на соответствующем пункте меню. Word автоматически исправит ошибку и уберет подчеркивание. Если вы считаете, что ошибки в данном месте текста нет и слово написано правильно, вы можете проигнорировать подчеркивание или нажать на контекстное меню «Пропустить все», доступное также по нажатию правой клавиши мыши.

Автозамена

Также вы можете активировать функцию автозамены, которая доступна в программах пакета Office. Данный параметр позволяет автоматически исправлять некорректно написанные слова в соответствии со списком, вручную создаваемым пользователем. Туда можно добавить слова, которые вызывают у вас проблемы в написании.

Для включения автоподстановки перейдите в секцию «Параметры» — «Правописание» — «Параметры автозамены». Поставьте галочку «Заменять при вводе». В поле «Заменить» укажите слова или фразы, которые вызывают у вас трудности при написании. В левой колонке впишите слово с ошибкой, а справа укажите правильный вариант написания. После добавления достаточного количества слов и фраз, нажмите «Ок» и сохраните произведенные изменения.

Знание русского языка не у всех идеально. Чтобы исправить досадные текстовые ошибки, воспользуйтесь компьютерными помощниками. Для этого в майкрософтском Word, например, достаточно включить проверку орфографии в Word.

  • Для Word 2003: Сервис — Параметры — Правописание — Автоматически проверять орфографию (установите флажок). Здесь же можно проверять грамматику, если установить флажок рядом с «Автоматически проверять грамматику».
  • Для Word 2007: Office — Параметры Word — Правописание — выбрать «Автоматически проверять орфографию».
  • Для Word 2010: Рецензирование — Правописание — нажать кнопку «Правописание». Для установки автоматической проверки орфографии сделать следующее: Файл — Справка — Параметры — нажать кнопку «Правописание». Чтобы включить/выключить проверку орфографии и грамматики в текущем документе, зайдите в раздел «Исключения для» и щелкните «Имя текущего файла». Снимите или установите флажки напротив «Скрыть грамматические ошибки в этом документе» и «Скрыть ошибки правописания в этом документе». Чтобы включить или выключить проверку орфографии во всех новых создаваемых документах, в разделе «Исключения для» выберите «Все новые документы» и установите или снимите флажки около «Скрыть грамматические ошибки в этом документе» и «Скрыть ошибки правописания в этом документе».

Правописание можно проверить в режиме онлайн и в браузере. Как включить проверку орфографии, коротко в нашей инструкции. Прежде всего, нужно открыть нужный браузер.

Mozilla Firefox

Перейдите по ссылке Словари и локализации . Затем войдите в меню браузера в «Правка» — «Настройки» — «Дополнительные» и нажмите на вкладку «Общие». Поставьте крестик в графе «Проверять орфографию при наборе текста».

Если не помогло, заходим на любой сайт и кликаем правой кнопкой мыши на поле для комментариев, в появившемся окне ставим галочку напротив «Проверки орфографии».

Opera

В этот браузер автоматически встроена проверка орфографии. Чтобы ее проверить, в поле для текста нужно нажать на правую кнопку мыши и отметить «Проверка орфографии». В принципе, это все. Ничего сложного, правда? Переходим к следующему веб-браузеру.

Google Chrome

Войдите в «Настройку и управление Google Chrome», выберите «Настройки». В конце страницы нажмите на «Показать дополнительные настройки». Найдите «Языки» и нажмите на кнопку «Настройки языков и проверки правописания…». Поставьте галочку около «Включить проверку правописания» и нажмите ОК.

IE (Internet Explorer)

В этом браузере не поддерживается онлайн-проверка правописания. В этом случае используйте плагин Speckie , который скачивается с официального сайта разработчика. После установки в контекстном меню добавьте в разделе «Словари» русский. Программа поддерживается только в версиях IE 6, 7, 8 и 9.

Safari

Как правило, в этом браузере функция проверки орфографии включена автоматически. Если нет, на панели инструментов в правом углу в «Меню» в разделе «Правка» — «Правописание и грамматика» поставьте галочку в нужном поле и нажмите на кнопку «ОК».

Проверка правописания – одна из тех функций, которой позавидовали бы писатели прошлых лет и даже операторы текста, работающие с печатными машинками. Ведь сейчас нет необходимости быть настолько внимательным, чтобы не допустить ошибки, из-за которой придется перепечатывать целую страницу. А в порыве вдохновения можно и вовсе забыть обо всех правилах пунктуации, грамматики и орфографии. Компьютер все исправит. Главное не забыть дать ему эту команду.

По умолчанию в Word включена автоматическая проверка правописания. В нижней части экрана у вас есть 2 индикатора: первый показывает, есть ли в тексте ошибки или нет, демонстрируя, соответственно, галочку или крестик. Рядом отображается язык словаря, который используется для проверки.

Для того, чтоб отключить или убедиться в том, что проверка включена, нажмите на язык, в данном случае «русский » и поставьте галочку напротив «Не проверять правописание ». Вот так легко избавиться от полезных, но удручающих подчеркиваний по тексту.

Ту же операцию можно сделать, перейдя по вкладке «Рецензирование », в разделе «Язык » нажать на пункт «Язык » и выбрать «Язык проверки правописания…»

Программа достаточно умна, чтобы самостоятельно определять, какой язык у вас используется в документе, даже если в одном предложении есть фразы на разных, однако для этого нужно убедиться, что стоит галочка напротив «Определять язык автоматически ».

Дополнительные настройки правописания доступны по следующему адресу: «Файл » -> «Параметры » -> «Правописание ». Первый и второй разделы отвечают за исключения и правила замены. А в третьем «При исправлении правописания в Word » вы вольны отключить, непосредственно функцию автоматической проверки.

Важной особенностью Microsoft Word является возможность подключать сторонние программы для проверки орфографии. Они созданы для более углубленной проверки и предоставления детальных определений грамматических правил. Однако и встроенные возможности, и словари Microsoft Word отлично справляются с основными языками.

Также вы, как пользователь, имеете возможность самостоятельно дополнять и улучшать свой словарь. Для этого, в случае ошибки, с которой вы не согласны, вы можете просто кликнуть на слово правой кнопкой мыши и нажать «Добавить в словарь ». Впоследствии данная фраза не будет считаться ошибкой.

В Word 2003 включение и отключение автоматической проверки орфографии осуществляется по адресу «Сервис » -> «Параметры » -> вкладка «Правописание » -> первый раздел «Орфография » -> «Автоматически проверять орфографию ».

Publisher для Office 365 Publisher 2019 OneNote 2013 Publisher 2016 Visio 2013 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Access 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Access 2010 Publisher 2010 Visio 2010 Project 2010 Excel 2007 Word 2007 Outlook 2007 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Project 2007 Project профессиональный 2013 Project стандартный 2010 Project стандартный 2013 Visio профессиональный 2013 Visio стандартный 2010 Меньше

Убедитесь, что для текста выбран правильный язык

Если средство проверки орфографии не проверяет слова, введенные на другом языке, или помечает правильно введенные иностранные слова как содержащие ошибку, возможно, язык для этих слов определен неправильно.

Чтобы вручную изменить язык отдельных слов или фрагмента текста в Word, выполните указанные ниже действия.

Убедитесь, что используется правильная языковая версия словаря

Убедитесь, что для словаря выбрана правильная региональная версия языка текста, например английский (США), а не английский (Соединенное Королевство).

Чтобы изменить словарь для определенного языка в Word , выполните указанные ниже действия.

Чтобы изменить словарь для выделенного текста, выполните указанные ниже действия.

Убедитесь, что флажок «Определять язык автоматически» установлен

Чтобы установить флажок

Примечания:

    Для правильной работы функции автоматического определения языка требуется хотя бы одно предложение. Если фразы слишком короткие, может потребоваться ввести несколько предложений, иначе у приложения Word будет недостаточно контекста для автоматического определения языка и применения нужного словаря.

    Одинаковое написание некоторых слов в разных языках (например, centre в английском (Соединенное Королевство) и французском (Франция)) может вести к тому, что функция Определять язык автоматически неправильно определяет язык текста. Чтобы устранить эту проблему, введите еще несколько слов на нужном языке или снимите флажок Определять язык автоматически .

Убедитесь, что флажок «Автоматически переключать раскладку клавиатуры в соответствии с языком окружающего текста» установлен

Если флажок установлен, это может привести к опечаткам при смене раскладки клавиатуры во время ввода текста. Введите еще несколько слов на нужном языке или снимите флажок Автоматически переключать раскладку клавиатуры в соответствии с языком окружающего текста .

Чтобы установить флажок Автоматически переключать раскладку клавиатуры в соответствии с языком окружающего текста (в Office 2010, Office 2013 и Office 2016), выполните указанные ниже действия.

Убедитесь, что флажок «Не проверять правописание» снят

Если флажок Не проверять правописание установлен, правописание в документах не проверяется.

Чтобы снять флажок Определять язык автоматически в приложении Word, выполните указанные ниже действия.

Убедитесь, что слово с ошибкой не было случайно добавлено в настраиваемый словарь

Если в настраиваемый словарь было добавлено слово с ошибкой, необходимо найти и удалить его. Сведения о том, как проверить настраиваемый словарь для слов с ошибками, см. в разделе Использование настраиваемых словарей для добавления слов в средство проверки орфографии . Сведения о том, как удалить слово из словаря, см. в разделе Добавление и изменение слов в словаре проверки орфографии .

В диалоговом окне «Язык» отсутствует нужный язык

Чаще всего причина отсутствия языка словаря в списке Язык словаря в диалоговом окне Язык заключается в том, что данный язык не включен в качестве языка редактирования или отсутствует в установленной версии набора Office и для него требуется установить языковой пакет. Сведения о том, как включить язык редактирования, см. в статье

Как отменить автоматическую проверку орфографии или грамматики. Отключить исправления Word документа. Параметры автоматической замены

Проверка правописания – одна из тех функций, которой позавидовали бы писатели прошлых лет и даже операторы текста, работающие с печатными машинками. Ведь сейчас нет необходимости быть настолько внимательным, чтобы не допустить ошибки, из-за которой придется перепечатывать целую страницу. А в порыве вдохновения можно и вовсе забыть обо всех правилах пунктуации, грамматики и орфографии. Компьютер все исправит. Главное не забыть дать ему эту команду.

По умолчанию в Word включена автоматическая проверка правописания. В нижней части экрана у вас есть 2 индикатора: первый показывает, есть ли в тексте ошибки или нет, демонстрируя, соответственно, галочку или крестик. Рядом отображается язык словаря, который используется для проверки.

Для того, чтоб отключить или убедиться в том, что проверка включена, нажмите на язык, в данном случае «русский » и поставьте галочку напротив «Не проверять правописание ». Вот так легко избавиться от полезных, но удручающих подчеркиваний по тексту.

Ту же операцию можно сделать, перейдя по вкладке «Рецензирование », в разделе «Язык » нажать на пункт «Язык » и выбрать «Язык проверки правописания…»

Программа достаточно умна, чтобы самостоятельно определять, какой язык у вас используется в документе, даже если в одном предложении есть фразы на разных, однако для этого нужно убедиться, что стоит галочка напротив «Определять язык автоматически ».

Дополнительные настройки правописания доступны по следующему адресу: «Файл » -> «Параметры » -> «Правописание ». Первый и второй разделы отвечают за исключения и правила замены. А в третьем «При исправлении правописания в Word » вы вольны отключить, непосредственно функцию автоматической проверки.

Важной особенностью Microsoft Word является возможность подключать сторонние программы для проверки орфографии. Они созданы для более углубленной проверки и предоставления детальных определений грамматических правил. Однако и встроенные возможности, и словари Microsoft Word отлично справляются с основными языками.

Также вы, как пользователь, имеете возможность самостоятельно дополнять и улучшать свой словарь. Для этого, в случае ошибки, с которой вы не согласны, вы можете просто кликнуть на слово правой кнопкой мыши и нажать «Добавить в словарь ». Впоследствии данная фраза не будет считаться ошибкой.

В Word 2003 включение и отключение автоматической проверки орфографии осуществляется по адресу «Сервис » -> «Параметры » -> вкладка «Правописание » -> первый раздел «Орфография » -> «Автоматически проверять орфографию ».

Каждый совершает ошибки. В данном случае речь идет об ошибках правописания. При письме, а особенно при наборе текста в текстовых редакторах, пользователь может совершить ошибку, набирая то или иное слово. Случается это по разным причинам, таким как незнание правил русского языка или простая опечатка из-за быстрого набора. Но во времена технологического прогресса текстовые редакторы способны в автоматическом режиме выявлять все ошибки и предлагать способы их решения.

В этой статье речь пойдет о том, как включить в «Ворде» проверку орфографии, как ею пользоваться и о многом другом, что как-то относится к исправлению опечаток в набранном тексте.

Включение проверки орфографии

Первоначально стоит уделить внимание вопросу, как включить в «Ворде» проверку орфографии. Хоть по умолчанию, после установки, она включена, по некоторым причинам пользователь может отключить ее, сам того не подозревая. В таких случаях используйте инструкцию, которая приложена ниже, чтобы возобновить работу данного инструмента.

  1. Находясь на главной странице программы, нажмите кнопку «Файл», которая располагается в верхнем левом углу.
  2. В меню, которое появилось, перейдите в раздел «Параметры».
  3. В появившемся окне нажмите на пункт «Правописание», располагающийся на панели слева.
  4. В меню «При использовании правописания в все галочки рядом с пунктами.
  5. В меню «Исключения для файла» уберите галочки, которые там расположены.
  6. Нажмите кнопку «ОК».

Теперь вы знаете, как в «Ворде» включить автоматическую проверку орфографии. После выполнения всех этих действий программу перезагружать не нужно, все изменения вступают в силу сразу после нажатия кнопки «ОК».

Проверяем орфографию в автоматическом режиме

После того как вы узнали, где в «Ворде» включить проверку орфографии, можно сразу же переходить непосредственно к использованию этого инструмента. Первым делом разберем выполнение всех действий в автоматическом режиме. Это не означает, что вам ничего не придется делать, напротив, программа автоматически будет вам указывать на предполагаемые ошибки в правописании, а вы будете решать, что нужно сделать для их исправления.

Итак, предположим, перед вами открыт документ, в котором есть ошибки. В этом случае они подчеркнуты цветными линиями (красной, синей или зеленой). Чтобы начать их исправление, вам нужно открыть панель инструмента «Орфография». Для этого нажмите клавишу F7 или кнопку «Правописание», которая расположена во вкладке «Рецензирование».

После этого в правой стороне окна появится панель «Орфография», в которой и будут проходить все действия. Сразу же в тексте выделится проблемное слово, и вам необходимо будет принять решение, что с ним делать. На выбор есть четыре действия:

  1. Пропустить — вы пропускаете предполагаемую ошибку и переходите к следующему слову, при этом выделение с него исчезает.
  2. Пропустить все — вы пропускаете все ошибки в тексте, снимая с них выделение.
  3. Добавить — вы добавляете слово в словарь программы, чтобы при нахождении такой же ошибки программа ее не воспринимала.
  4. Изменить — вы изменяете слово с ошибкой на выбранное из списка предложенных.
  5. Изменить все — вы изменяете все подобные слова с ошибками на выбранное из списка.

Зная значение всех кнопок на панели, вы запросто сможете исправить все ошибки в тексте. В крайнем случае, если ни одно исправление не верно, вы можете заменить слово самостоятельно.

Проверяем орфографию в ручном режиме

Вы уже знаете, как включить автоматическом режиме. Однако это не единственный способ исправить все ошибки в тексте. Сейчас мы подробно разберемся, как включить проверку орфографии в «Ворде» в ручном режиме.

Для выполнения поставленной задачи вам необходимо изначально обратить внимание на сами подчеркивания в тексте. Мы уже знаем, что это ошибки. Исправить их можно не только по нажатию F7, но и правой кнопки мыши (ПКМ). Делается это просто: наведите курсор на подчеркнутое слово и нажмите ПКМ, в контекстном меню помимо привычных пунктов появятся дополнительные, которые дублируют кнопки в панели «Орфография», их значение вы уже знаете. Все, что остается, — это выбрать необходимое действие и нажать по соответствующей строке.

Заключение

Теперь вы знаете не только о том, как включить проверку орфографии в «Ворде», но и как ею пользоваться. Как можно заметить, суть проста, вам необходимо лишь указать нужное действие, и программа самостоятельно все заменит.

Вопрос не совсем понятен. Что имеется в виду? Потому что вариантов тут два:

  1. Из серии: «Уберите это проклятые красные волнистые подчеркивания!».
  2. Вы получили по почте от начальника свой документ, а там какие-то исправления, зачеркивания, примечания.

На этом уроке рассмотрим первый вариант, а второй — в статье . Итак…
Вам надоело любоваться на волнистые подчеркивания в документе, с которым часто приходится работать.
Word подчеркивает красным не только слова с ошибками, но и любые незнакомые ему слова. И слова на другом языке, отличном от языка подключенного модуля проверки правописания. Если вы уверены в правильности написания слова, а пользоваться им приходится часто, его можно добавить в словарь. После этого оно уже не будет подчеркиваться во всех документах. А можно вообще отключить показ ошибок только в данном документе.

Как отключить проверку правописания в Word 2007


ВКЛЮЧИТЕ СУБТИТРЫ!
Нажмите на кнопку «Office». Внизу справа найдите кнопку «Параметры Word».

  • В окне параметров выберите «Правописание».
  • Поставьте флажки в разделе «Исключения для файла», как указано на рисунке и нажмите «ОК».


Собственно, мы не стали отключать проверку правописания, мы просто отключили раздражающий нас показ наших ошибок.
Все, в этом документе вы никаких волнистых линий больше не увидите.

Как это сделать в Word 2003


ВКЛЮЧИТЕ СУБТИТРЫ!

  • Меню «Сервис».
  • «Параметры».
  • В окне параметров перейдите на закладку «Правописание».
  • Поставьте флажки «Не выделять слова с ошибками» в разделах «Орфография» и «Грамматика».


Покоряйте Word и до новых встреч!

Word – пожалуй лучшее решение для набора текста и редактирования текстовых документов. Среди множества возможностей данной программы, одной из наиболее полезных является проверка орфографии и грамматики.

Но, с этой функцией у многих пользователей возникают проблемы. В этом материале мы расскажем о том, как включить проверку орфографии в Word 2007, 2010, 2013 и 2016.

Включение автоматической проверки орфографии в Word

По умолчанию, текстовый редактор Word всегда автоматически проверяет орфографию. Если у вас этого не происходит, то, скорее всего, это функция просто выключена в настройках. Для того чтобы обратно включить проверку орфографии в Word вам нужно нажать на кнопку «Файл » в верхнем левом углу программы и в открывшемся меню выбрать пункт «Параметры ».

На скриншотах внизу мы продемонстрируем, как выглядит меню «Файл » в Word 2007, 2010, 2013 и 2016.

Меню Файл в Word 2007

Меню Файл в Word 2010

Меню Файл в Word 2013, 2016

После того, как вы открыли «Параметры Word », вам нужно перейти в раздел «Правописание » и включить там функции, которые имеют отношение к проверке орфографии в Ворде.

  • Проверять орфографию в процессе набора текста;
  • Использовать контекстную проверку орфографии;
  • Отмечать ошибки грамматики в процессе набора текста;
  • Во время проверки орфографии, также проверять грамматику;

Нужно отметить, что данные функции могут называться немного по-другому в вашей версии Word. Также не забудьте, что изменения настроек нужно сохранить с помощью кнопки «Ok ».

Ручной запуск проверки орфографии в Word

Также вы можете вручную включить проверку орфографии в Word. Для этого нужно выделить текст, для которого вы хотите запустить проверку, перейти на вкладку «Рецензирование » и нажать на кнопку «Правописание ».

В результате должно открыться окно «Правописание », котором вы сможете проверить орфографию текста слово за словом. Слова, в которых текстовый редактор Word обнаружит ошибки будут подсвечены красным цветом. При этом под текстом будет предложено несколько вариантов написания данного слова. Для того чтобы исправить данное слово, вам нужно выбрать один из вариантов для замены и нажать на кнопку «Заменить ».

Если вы считаете, что слово написано правильно, то вы можете пропустить его. Для этого есть кнопка «Пропустить ».

Также с помощью кнопки «Добавить » вы можете добавить правильно написанное слово в словарь.

Слова, которые были добавлены пользователем в словарь, Word больше не будет помечать как ошибки.

Как изменить язык для проверки орфографии в Word

Если проверка орфографии выполняется по правилам другого языка, то вам нужно изменить язык текста. Для этого выделите текст, который неправильно проверяется, и нажмите на название языка, внизу окна Word.

После этого появится небольшое окно «Язык ». Здесь нужно выделить язык, по правилам которого должна выполняться проверка орфографии, и нажать на кнопку «Ok ».

Также с помощью окна «Язык » можно полностью отключить проверку орфографии для выбранной части текста. Для этого нужно выделить текст, нажать на название языка, и в окне «Язык » включить функцию «Не проверять правописание ».

Как разом исправить все ошибки в ворде. Проверка орфографии

Word – пожалуй лучшее решение для набора текста и редактирования текстовых документов. Среди множества возможностей данной программы, одной из наиболее полезных является проверка орфографии и грамматики.

Но, с этой функцией у многих пользователей возникают проблемы. В этом материале мы расскажем о том, как включить проверку орфографии в Word 2007, 2010, 2013 и 2016.

Включение автоматической проверки орфографии в Word

По умолчанию, текстовый редактор Word всегда автоматически проверяет орфографию. Если у вас этого не происходит, то, скорее всего, это функция просто выключена в настройках. Для того чтобы обратно включить проверку орфографии в Word вам нужно нажать на кнопку «Файл » в верхнем левом углу программы и в открывшемся меню выбрать пункт «Параметры ».

На скриншотах внизу мы продемонстрируем, как выглядит меню «Файл » в Word 2007, 2010, 2013 и 2016.

Меню Файл в Word 2007

Меню Файл в Word 2010

Меню Файл в Word 2013, 2016

После того, как вы открыли «Параметры Word », вам нужно перейти в раздел «Правописание » и включить там функции, которые имеют отношение к проверке орфографии в Ворде.

  • Проверять орфографию в процессе набора текста;
  • Использовать контекстную проверку орфографии;
  • Отмечать ошибки грамматики в процессе набора текста;
  • Во время проверки орфографии, также проверять грамматику;

Нужно отметить, что данные функции могут называться немного по-другому в вашей версии Word. Также не забудьте, что изменения настроек нужно сохранить с помощью кнопки «Ok ».

Ручной запуск проверки орфографии в Word

Также вы можете вручную включить проверку орфографии в Word. Для этого нужно выделить текст, для которого вы хотите запустить проверку, перейти на вкладку «Рецензирование » и нажать на кнопку «Правописание ».

В результате должно открыться окно «Правописание », котором вы сможете проверить орфографию текста слово за словом. Слова, в которых текстовый редактор Word обнаружит ошибки будут подсвечены красным цветом. При этом под текстом будет предложено несколько вариантов написания данного слова. Для того чтобы исправить данное слово, вам нужно выбрать один из вариантов для замены и нажать на кнопку «Заменить ».

Если вы считаете, что слово написано правильно, то вы можете пропустить его. Для этого есть кнопка «Пропустить ».

Также с помощью кнопки «Добавить » вы можете добавить правильно написанное слово в словарь.

Слова, которые были добавлены пользователем в словарь, Word больше не будет помечать как ошибки.

Как изменить язык для проверки орфографии в Word

Если проверка орфографии выполняется по правилам другого языка, то вам нужно изменить язык текста. Для этого выделите текст, который неправильно проверяется, и нажмите на название языка, внизу окна Word.

После этого появится небольшое окно «Язык ». Здесь нужно выделить язык, по правилам которого должна выполняться проверка орфографии, и нажать на кнопку «Ok ».

Также с помощью окна «Язык » можно полностью отключить проверку орфографии для выбранной части текста. Для этого нужно выделить текст, нажать на название языка, и в окне «Язык » включить функцию «Не проверять правописание ».

Для включения проверки правописания в Microsoft Office откройте программный продукт Word, воспользовавшись ярлыком на рабочем столе или пунктом меню «Пуск» — «Все программы» — Microsoft Office – Microsoft Word. Кликните на вкладке «Файл» (Microsoft Office 2013) или нажмите на кнопку Office (Microsoft Office версии 2010 и 2007). Перейдите в раздел «Параметры» и нажмите на пункте «Правописание». Выберите меню «Исключения» и щелкните поле «Имя текущего файла». После этого снимите флажок со строчки «Скрыть ошибки правописания» и «Скрыть грамматические ошибки».

Если вы хотите включить автоматическую проверку правописания для всех документов, которые вы открываете Microsoft Office, в секции «Исключения» поставьте опцию «Все новые документы». Снимите соответствующие флажки «Скрыть» и сохраните произведенные изменения, нажав на кнопку «Ок».

В программе PowerPoint включение автоматической проверки правописания можно выполнить из аналогичного меню «Параметры» — «Правописание». Снимите флажок с пункта «Скрывать орфографические ошибки» и сохраните произведенные изменения.

Механизм работы

При возникновении ошибки в тексте Word подчеркнет ее красной, синей или зеленой линией. Красная линия используется для фиксирования орфографических ошибок. Недочеты в пунктуации указываются при помощи синей линии, а грамматические ошибки выделяются зеленой волнистой линией. Чтобы просмотреть возможные варианты написания и исправления ошибки, кликните правой клавишей мыши на слове или фразе.

Если вы принимаете предложенный Word вариант, выберите его, нажав на соответствующем пункте меню. Word автоматически исправит ошибку и уберет подчеркивание. Если вы считаете, что ошибки в данном месте текста нет и слово написано правильно, вы можете проигнорировать подчеркивание или нажать на контекстное меню «Пропустить все», доступное также по нажатию правой клавиши мыши.

Автозамена

Также вы можете активировать функцию автозамены, которая доступна в программах пакета Office. Данный параметр позволяет автоматически исправлять некорректно написанные слова в соответствии со списком, вручную создаваемым пользователем. Туда можно добавить слова, которые вызывают у вас проблемы в написании.

Для включения автоподстановки перейдите в секцию «Параметры» — «Правописание» — «Параметры автозамены». Поставьте галочку «Заменять при вводе». В поле «Заменить» укажите слова или фразы, которые вызывают у вас трудности при написании. В левой колонке впишите слово с ошибкой, а справа укажите правильный вариант написания. После добавления достаточного количества слов и фраз, нажмите «Ок» и сохраните произведенные изменения.

Любая операционная система на базе Windows дает сбои после долгого срока работы. Системные диски засоряются остаточными и временными файлами, программами. Беспорядок в системе приводит к понижению общей производительности. Устройство долго загружается, медленно выполняет операции. Самая большая проблема пользователей – возникновение ошибок на фоне сбоев в Windows 7. Существуют внутренние и внешние способы устранения ошибок в системе. Внутренние подразумевают использование мощностей и ресурсов Windows, при внешних способах применяются программы и утилиты.

Проверка диска с помощью CHKDSK

CHKDSK – служебная утилита, встроенная в операционную систему. Предназначение утилиты заключается в восстановлении поврежденных секторов на жестком диске. Также, CHKDSK исправляет ошибки системных файлов. Утилита запускается из командной строки в Windows 7. Запустить командную строку можно несколькими способами:

  • Сочетанием клавиш на клавиатуре Win+R;
  • Клавиша Пуск, в поисковой строке ввести запрос «cmd»;
  • Клавиша Пуск, Программы, Стандартные, Командная строка.

В открывшемся черном окне вводится команда: «chkdsk C: /F». Значение команды:

  • Chkdsk – проверка диска;
  • С: — название системного диска, буква может быть другой, двоеточие обязательно;
  • /F – обозначение действия, система автоматически проверит себя на наличие ошибок, устранит их.

После ввода команды следует нажать кнопку Enter. При следующей перезагрузке система проведет проверку и исправление на ошибки.

Проверка командой sfc scannow

Утилита также запускается из командной строки. Для запуска проверки понадобятся права Администратора. В командной строке нужно ввести «sfc /scannow». Система автоматически проверит файлы, в том числе, закрытые, исправит ошибки, восстановит поврежденные из кэшированной копии.

Стандартная диагностика проблем Windows

Использование командной строки подходит продвинутым пользователям. Тем, кто плохо разбирается в работе компьютеров, подходит оконный вариант диагностики и устранения неполадок. Дополнительно пользователям операционной системы Windows 7 доступны средства по поиску решений и скачиванию важных обновлений в Центрах обновлений и поддержки.

Устранение неполадок в Панели управления

Это внутренняя программа Windows, позволяющая диагностировать систему на наличие ошибок и поиску решений для их устранения. Запустить ее можно следующим способом:


Откроется окно со списком всех системных возможностей компьютера. В большинстве случаев достаточно запустить проверку пункта «Быстродействие». Двойным кликом по выбранному пункту пользователь запустит проверку. Чтобы система сразу устраняла ошибки, следует поставить галочку на «Автоматически применять исправления».

Поиск решений в Центре поддержки

Средство Центр поддержки отслеживает состояние операционной системы, сохраняет отчеты об ошибках и сбоях. Посредством Центра можно находить произошедшие неполадки, исправлять их.

Для исправления ошибок в системе следует перейти в раздел «Обслуживание» Центра.

Проверка обновлений в Центре обновлений

Windows 7 уже считается устаревшей. Корпорация Microsoft прекратила активную поддержку пользователей на этой версии операционной системы, однако обновления выходят по-прежнему. Их установка необязательно, но система исправляет ошибки, восстанавливает поврежденные файлы в процессе скачивания очередных обновлений.

На недавно установленной Windows обновления ищутся и скачиваются автоматически. Если эта опция отключена, пользователь может запустить процесс вручную:

  1. Нажать кнопку Пуск;
  2. Войти в разделы Панель управления, Система и безопасность;
  3. Выбрать пункт Центр обновлений Windows;
  4. В левой части окна кликнуть по пункту «Поиск обновлений»;
  5. Дождаться завершения процедуры.

Система предложит установить найденные обновления. Рекомендуется согласиться.

Программы для исправления ошибок

Для операционных систем Windows разработано множество программ, способных улучшить производительность, исправить ошибки, удалить реестровые ошибки. Такие утилиты немного весят, не отнимают ресурсов компьютера.

Advanced System Care

Утилита приводит компьютер в порядок комплексно. Advanced System Care распространяется бесплатно, скачать можно на сайте разработчика .

Важно! При установке следует внимательно читать предложенную информацию, убирать галочки с пунктов установки дополнительного, рекламного ПО.

После установки и запуска Advanced System Care, перед пользователем появится окно с простым интерфейсом. Предлагается 2 режима работы с утилитой, упрощенный и экспертный. В любом из режимов достаточно нажать большую кнопку «Пуск». Утилита самостоятельно проверит систему на:

  • Вирусы;
  • Ошибочные записи в реестре;
  • Временные, остаточные, нежелательные файлы;
  • Проблемы в работе сети;
  • Ошибочные ярлыки;
  • Возможные угрозы для конфиденциальности.

По команде пользователя все угрозы или часть из них будут удалены.

Ccleaner

Одна из лучших программ для очистки и исправления реестра для операционных систем Windows. Ccleaner распространяется бесплатно. Как и в предыдущем случае, рекомендуется внимательно читать информацию в установочных окнах. Скачать Ccleaner можно на официальном сайте разработчика .

После запуска программы перед пользователем 2 меню. В левой части основные функции, в правой – запуск конкретных операций. Работа с Ccleaner проходит в 3 этапа:

  1. Вкладка «Сервис». Здесь есть перечень всех установленных программ на ПК. Их можно деинсталлировать. Присутствуют также вкладки автозагрузки, поиска дублирующихся файлов, анализ системных дисков.
  2. Вкладка «Реестр». Рекомендуется переходить к ней после удаления программ. Ccleaner найдет все ошибочные записи в системе, предложит исправить или удалить их.
  3. Вкладка «Очистка». Утилита обнаруживает временные файлы системы и браузеров, удаляет их. Данная процедура позволяет очистить место на системном диске.

Вышеперечисленные действия позволят существенно улучшить производительность ПК. Рекомендуется регулярно проводить анализ и чистку утилитой Ccleaner.

Windows 7 Manager

Утилита Windows 7 Manager позволяет проводить полноценное обслуживание операционной системы. Скачать ПО можно .

Windows 7 Manager работает по аналогии с Ccleaner, но дает пользователю доступ к расширенному функционалу по оптимизации, очистке, работе с сетью и защите ПК.

Чтобы найти и исправить ошибки в Windows 7, следует последовательно выбрать пункты в левом меню, провести анализ и очистку системы.

Microsoft Fix It

ПО создано специально для работы с Windows. Скачивается и устанавливается утилита Microsoft Fix It бесплатно. В окне утилиты пользователю предлагается список средств системы, для каждого из которых можно запустить проверку на ошибки с последующим исправлением.

Fix It разработана компанией Microsoft и является одним из официальных средств для устранения неполадок.

AVG PC Tune Up

Программа создана разработчиками известного антивируса AVG. Скачивание и использование программы бесплатное. Создатели AVG PC Tune Up обещают, что компьютеры после использования утилиты работают быстрее и дольше не ломаются.

Для использования возможностей AVG PC Tune Up, достаточно установить ее и поэтапно запускать проверку, устранение ошибок.

Kaspersky Cleaner

Бесплатная утилита от компании, предлагающей антивирусное ПО. Kaspersky Cleaner очень прост в применении. Скачать его можно .

После запуска пользователю предлагается нажать всего 1 кнопку для поиска и устранения внутренних проблем операционной системы.

Список системных ошибок при синем экране

Большинство пользователей начинают беспокоиться о состоянии системы только при регулярном появлении синего экрана «смерти». Ниже предложен список самых распространенных.

Номер ошибки Что значит
0x00000001 Ошибки в файловой системе, драйверах. Недостаток места на жестком диске/в оперативной памяти
0x0000000A Неверный адрес драйвера устройства
0x0000001E Проблема с драйвером или функцией ОС
0x00000020 Один из счетчиков APC отключен/поврежден
0x00000023 Сбой в разделе жесткого диска (FAT)
0x00000024 Сбой жесткого диска (NTFS)
0x0000002A Отключение IPR в процессе выполнения команды драйвером
0x0000002B Драйвер ядра использует слишком много места в стеке
0x0000002E Сбой в области оперативной памяти
0x00000031 Ошибка инициализации системы (ранняя стадия)
0x00000032 Ошибка инициализации системы (поздняя стадия)
0x00000035 Нет свободного места в стеке ОС для взаимодействия драйверов
0x00000036 Попытка удаления компонента, который находился в работе
0x0000003E Процессы системы не соответствуют друг другу по уровню/симметрии

Перечисленные ошибки решаемы запуском проверки и исправления, откатом системы или переустановкой Windows.

Сброс настроек в BIOS

Этот способ подходит в случаях, когда пользователь установил некорректные настройки на компьютере, но не знает, в чем именно заключается ошибка. Вход в BIOS на разных устройствах проводится в момент включения. Для запуска меню BIOS нужно удерживать одну из горячих клавиш (уточнить можно на сайте производителя). Чаще всего, это кнопки F8, F10, Del.

На старых типах BIOS сброс к настройкам по умолчанию проводился на главной странице. «Пункт Load Fail-Safe Defaults».

На новых ПК и ноутбуках эта функция находится в правой вкладке «Exit», обычно именуется как «Load Setup Defaults».

Использование безопасного режима работы

В некоторых случаях система повреждена настолько, что не запускается в привычном оконном формате. Запустить проверку и устранение ошибок можно в безопасном режиме через командную строку (см. выше).

На большинстве устройств безопасный режим запускается при частом нажатии кнопки F8 в момент включения. Появится загрузочное меню, где следует выбрать вариант. Указатель перемещается кнопками «вверх» и «вниз», выбор делается клавишей Enter.

Восстановление системы

Если исправление ошибок не приводит к ожидаемому результату, следует попытаться восстановить систему к более работоспособному состоянию. Самый простой алгоритм:

Компьютер перезагрузится, будет функционировать правильно.

Восстановление в среде Windows RE

Данный метод подходит в случаях, когда не помогает вообще ничего. Восстановление в среде Windows RE проводится не из операционной системы, а из-под BIOS. Алгоритм действий:

  1. Вставить диск или загрузочную флешку с записанной Windows 7;
  2. Включить устройство, войти в BIOS;
  3. В разделе Advanced Features выбрать запуск ПК с диска или USB устройства;
  4. Перезагрузить;
  5. В открывшемся при загрузке меню выбрать один из вариантов восстановления, подходящий пользователю.

Рекомендуется выбирать «Восстановление запуска» для устранения неполадок, восстановления поврежденных файлов. «Восстановление системы» проводит комплексное устранение неполадок. Также в среде Windows RE доступна командная строка, через которую можно запустить внутренние утилиты для проверки и устранения неполадок.

Пожаловаться на контент


  • Нарушение авторских прав Спам Некорректный контент Сломанные ссылки


  • Отправить

    Проверка правописания – одна из тех функций, которой позавидовали бы писатели прошлых лет и даже операторы текста, работающие с печатными машинками. Ведь сейчас нет необходимости быть настолько внимательным, чтобы не допустить ошибки, из-за которой придется перепечатывать целую страницу. А в порыве вдохновения можно и вовсе забыть обо всех правилах пунктуации, грамматики и орфографии. Компьютер все исправит. Главное не забыть дать ему эту команду.

    По умолчанию в Word включена автоматическая проверка правописания. В нижней части экрана у вас есть 2 индикатора: первый показывает, есть ли в тексте ошибки или нет, демонстрируя, соответственно, галочку или крестик. Рядом отображается язык словаря, который используется для проверки.

    Для того, чтоб отключить или убедиться в том, что проверка включена, нажмите на язык, в данном случае «русский » и поставьте галочку напротив «Не проверять правописание ». Вот так легко избавиться от полезных, но удручающих подчеркиваний по тексту.

    Ту же операцию можно сделать, перейдя по вкладке «Рецензирование », в разделе «Язык » нажать на пункт «Язык » и выбрать «Язык проверки правописания…»

    Программа достаточно умна, чтобы самостоятельно определять, какой язык у вас используется в документе, даже если в одном предложении есть фразы на разных, однако для этого нужно убедиться, что стоит галочка напротив «Определять язык автоматически ».

    Дополнительные настройки правописания доступны по следующему адресу: «Файл » -> «Параметры » -> «Правописание ». Первый и второй разделы отвечают за исключения и правила замены. А в третьем «При исправлении правописания в Word » вы вольны отключить, непосредственно функцию автоматической проверки.

    Важной особенностью Microsoft Word является возможность подключать сторонние программы для проверки орфографии. Они созданы для более углубленной проверки и предоставления детальных определений грамматических правил. Однако и встроенные возможности, и словари Microsoft Word отлично справляются с основными языками.

    Также вы, как пользователь, имеете возможность самостоятельно дополнять и улучшать свой словарь. Для этого, в случае ошибки, с которой вы не согласны, вы можете просто кликнуть на слово правой кнопкой мыши и нажать «Добавить в словарь ». Впоследствии данная фраза не будет считаться ошибкой.

    В Word 2003 включение и отключение автоматической проверки орфографии осуществляется по адресу «Сервис » -> «Параметры » -> вкладка «Правописание » -> первый раздел «Орфография » -> «Автоматически проверять орфографию ».

    Проверка орфографии в Ворде. Писать грамотно, особенно на сайтах или блогах, это главное условие того, что люди будут приходить к вам. Очень неприятно, когда видишь кучу грубейших ошибок. Можно понять, когда человек просто ошибся клавишей, но когда видишь явного «двоечника», то это отталкивает. Я тоже часто спешу за своими мыслями и могу пропустить, букву или даже целое слово, или запятую. При написании статей мне очень помогает программа Microsoft Word. Если её правильно настроить, то это будет незаменимый помощник в ваших творческих делах. У этой программы огромные возможности. По мере написания текста она может проверить орфографию, грамматику, устранить самостоятельно вашу ошибку, подсказать какое слово лучше употребить в этом стиле письма, подобрать синонимы и многое другое. Опять же повторюсь – главное правильно её настроить.

    Намного быстрее и комфортнее работать в текстовом редакторе, когда заранее создан или готовый с продуманными .

    Откроется окно Параметры . Выберите вкладку Правописание .

    А сегодня мы настроим Word для проверки орфографии и грамматики.

    Для того, чтобы программа автоматически проверяла орфографию и грамматику в вашем тексте откройте меню Сервис . Выберите команду Параметры .

    • В поле Орфография установите галочку на Автоматически проверять орфографию ;

    • В поле Грамматика установите галочку на Автоматически проверять грамматику и Также проверять орфографию .

    • На свойстве Не выделять слова с ошибками галочку ставить не надо, иначе, если вы совершите ошибку, программа не покажет вам её, а вы можете не заметить.

    • Остальные все настройки можете оставить как есть.

    Далее нажимаем кнопку Настройка под окошком Набор правил и переходим в окно Настройка грамматической проверки . В окошке Используемый набор правил выберите необходимый вам набор. Лично я использую Для деловой переписки .

    Установите переключатель на Грамматика и установите в окне ниже галочки на все функции. Всё остальное оставьте как есть, и нажмите кнопку ОК .

    Проверка орфографии в word 2007

    Для настройки автоматической проверки орфографии в Word 2007 щелкните в самом верху слева по красивому значку с логотипом программы, и перейдите в самый низ, открывшегося списка. Нажмите на кнопку Параметры Word .

    В следующем окне перейдите на вкладку Правописание и проставьте галочки там, где необходимо.

    После всех изменений не забудьте в самом низу нажать кнопку ОК , для сохранения настроек.

    Проверка орфографии в word 2010

    В текстовом редакторе Word 2010 настройка на проверку орфографии немного отличается от настройки в Word 2007.

    Необходимо сначала войти в меню Файл . Потом перейти вниз на запись Параметры .

    А уже в окне Параметры Word произвести настройки, которые описаны выше.

    После настройки проверки орфографии в Ворде программа сама будет проверять и указывать на ошибки подчеркиванием волнистой линией. Красная линия — означает орфографическую ошибку, а зеленая – синтаксическую.

    В отношении запятых программа не всегда правильно указывает их расположение, поэтому иногда думайте сами. А вот насчёт орфографии – она не ошибается.

    Если программа какие-то слово не знает, т.е. в её словаре этого слова нет, то можете сами добавить это слово в словарь, только перед этим проверьте, хотя бы в Интернете правильное его написание.

    Исправление орфографии в 1000 раз быстрее. Субмиллисекундная составляющая осведомлена… | by Wolf Garbe

    Менее миллисекунды соединение осведомленный автоматическая коррекция орфографии

    Источник: https://www.flickr.com/photos/theredproject/3968278028

    Недавно мне указали на два интересных поста о орфографической коррекции (и здесь ). Они применили подход глубокого обучения, философский камень современности. Удивительно, насколько универсальным является глубокое обучение, когда AlphaGo выигрывает чемпионаты по го, Watson выигрывает Jeopardy, борется с фейковыми новостями и угрожает человечеству сингулярностью.

    Вопрос заключается в том, сможет ли многофункциональный инструмент глубокого обучения превзойти и заменить узкоспециализированные алгоритмы и структуры данных в каждой области, если они оба заслуживают своего места или они будут сиять, если их взаимодополняющие преимущества будут объединены. Между тем за первоначальным энтузиазмом в отношении глубокого обучения в области орфографической коррекции последовало некоторое разочарование.

    Причиной, по которой они прибегли к глубокому обучению, было то, что они считали «ужасной» производительностью обычной проверки орфографии (которая оценивалась в ~0.1 секунда на написание короткого слова ).

    Хотя до сих пор не сообщалось о производительности исправления и потреблении памяти для подхода глубокого обучения, я знал, что исправление орфографии можно выполнить намного быстрее, чем за 0,1 секунды.

    SymSpell, основанный на алгоритме исправления орфографии Symmetric Delete, только что занял 0,000033 секунды (дистанция редактирования 2) и 0,000180 секунды (дистанция редактирования 3) на старом MacBook Pro.

    Но опять же, их подход позволял работать с более сложными выражениями, такими как «Где любовь» !

    SymSpell всегда ожидал один входной термин и не мог исправить пробелов, вставленных в слово или пробелов, отсутствующих между двумя словами .

    Мое любопытство пробудилось, и я решил попробовать, сможет ли дополнительный алгоритмический слой поверх SymSpell справиться с этим.

    SymSpellCompound поддерживает автоматическую коррекцию орфографии с учетом состава входных строк, состоящих из нескольких слов. Он построен на основе алгоритма исправления орфографии SymSpell, который в 1 миллион раз быстрее.

    1. Составное разбиение и разложение

    SymSpell принял каждую входную строку как один термин . SymSpellCompound поддерживает составное разбиение/разложение в трех случаях:

    1. ошибочно вставленный пробел в правильном слове привел к двум неверным терминам
    2. ошибочно пропущен пробел между двумя правильными словами привел к одному неверному комбинированному термину
    3. входные термины с/без орфографических ошибок

    Ошибки разделения, конкатенации, замены, транспонирования, удаления и вставки могут быть смешаны в одном слове.

    2. Автоматическое исправление орфографии

    • Большие коллекции документов делают ручное исправление невозможным и требуют полностью автоматического исправления орфографии без присмотра.
    • При обычном исправлении орфографии одного токена пользователю предоставляются предложения по исправлению орфографии.
      Для автоматического исправления орфографии длинного текста, состоящего из нескольких слов, алгоритм сам должен сделать осознанный выбор.

    Примеры:

    Как это работает

    Отдельные токены

    Входная строка разбивается на токены.Затем используется алгоритм исправления орфографии Symmetric Delete, чтобы получить предложения для каждого токена в отдельности.

    Комбинированные токены

    Кроме того, проверяются предложения для каждой биграммы (объединенной пары последовательных токенов), но только если один из двух последовательных токенов не дает предложений или лучшее предложение имеет расстояние редактирования > 1.

    Предложение для комбинированного токена предпочтительнее, если предложение(токен1+токен2).editDistance+1 < предложение(токен1).editDistance+suggestion(token2).editDistance

    Разделить токены

    Кроме того, генерируются все пары подтерминов из токена, но только если этот токен не был объединен, если токен состоит из нескольких символов и если наилучшее предложение токен имел editDistance > 0.

    Генерация словаря

    Качество словаря имеет первостепенное значение для качества исправления. Для этого два источника данных были объединены путем пересечения:

    Данные Google Книги Ngram, которые содержат репрезентативные частоты слов , но содержат много записей с орфографическими ошибками и SCOWL — списки слов, ориентированные на проверку орфографии, которые обеспечивают подлинный английский словарь но не требуется частота слов для ранжирования предложений в пределах одного и того же расстояния редактирования.

    Производительность

    0,0002 секунды/слово
    5000 слов/секунду (одноядерный на Macbook Pro 2012 года)

    Приложения

    Для одного пользователя или для небольших расстояний редактирования могут подойти другие алгоритмы. Но для поисковых систем и поиска как службы API поиска, где вы должны обслуживать тысячи одновременных пользователей, сохраняя при этом задержку в несколько миллисекунд, и где исправление орфографии является даже не основной задачей обработки, а лишь одним из многих компонентов в предварительной обработки запроса, вам нужна самая быстрая коррекция орфографии, которую вы можете получить.

    Словарь частот

    Список частот слов был создан путем пересечения двух списков, упомянутых ниже. При взаимной фильтрации используются только те слова, которые появляются в обоих списках. Были применены дополнительные фильтры, и результирующий список сократился до ≈ 80 000 наиболее часто встречающихся слов.

    Сообщения в блогах: Алгоритм, тесты, приложения

    1000x Более быстрый алгоритм исправления орфографии
    Быстрое приблизительное сопоставление строк с большими расстояниями редактирования в больших данных
    Очень быстрая очистка данных названий продуктов, названий компаний и названий улиц

    Если орфографическая ошибка одновременно является допустимым словом (т.грамм. сообщение против сообщения) в настоящее время не исправлено .

    Частоты слов можно использовать для ранжирования, но иногда редкое слово может быть правильным в данном контексте.

    Вероятности биграмм могли бы обеспечить контекст, но часто контекст не исходит из последовательных терминов, а скрыт дальше в тексте. Сбор и хранение вероятностей совпадения для всех комбинаций терминов словаря в скользящем окне может быть непомерно чрезмерным.

    Мы могли бы прибегнуть к грамматике и элементам предложений и SyntaxNet .

    Мы можем догадаться о намерении/причине ошибки автора, используя близость клавиатуры , фонетическую близость и прошлые предпочтения авторов в словарном запасе .

    Ложные срабатывания могут возникать, когда правильные, но неизвестные слова находятся в пределах editDistanceMax других известных слов.

    Проверка орфографии и грамматики | Локализовать документы

    Проверка орфографии и грамматики

    Мы предлагаем встроенные проверки орфографии и грамматики на более чем 20 языках.

    Автор Ник Устинов
    Обновлено больше недели назад

    Lokalise автоматически проверяет орфографию и грамматику в редакторе, когда вы загружаете или обновляете фразы. Если была обнаружена орфографическая или грамматическая ошибка, она будет выделена для вас:

    Вы можете нажать на выделенные ошибки, чтобы увидеть возможные исправления или добавить слово/ошибку в список игнорирования.

    Чтобы отключить проверку орфографии и грамматики, отключите соответствующую опцию в верхнем меню:

    При обнаружении ошибки вы также увидите предупреждение от проверки качества:

    Эту проверку можно отключить в настройках проекта в разделе QA проверяет вкладку :

    Поддерживаемые языки

    Мы используем LanguageTool для проверки орфографии.В настоящее время эта услуга поддерживает следующие языки (обратите внимание, что для некоторых языков предложений для беспризорных ошибок не поддерживаются):

    • арабский

    • Asturian

    • Белорусский

    • Breton

    • Catalan (Valengian)

    • Китайский

    • Английский (австралийский, канадский, ГБ, Новая Зеландия, Южноафриканский, США)

    • Esperanto

    • Французский

    • Галицкий

    • Немецкий (Австрия, Германия, Германия, Швейцарская)

    • Греча

    • Японский

    • Khmer

    • Персидский

    • Polish

    • Португальский (Ангола, Бразилия, Мозамбик, Португалия)

    • Румынский

    • Русский

    • Словацкий

    • Словенский

    • Испанский

    • Шведский

    • тагальского

    • Тамил

    • Украинский

    Орфографические исправления и предложения Google

    Не знаете, как что-то написать? Не волнуйтесь, попробуйте гессинг или орфографию любым доступным вам способом.Всего за несколько первых месяцев работы инженер Google Ноам Шазир разработал систему исправления правописания (подсказок) на основе того, что ввели другие пользователи. Система автоматически проверяет, используете ли вы наиболее распространенное написание каждого слова в своем запросе.

    (Раньше мы предлагали вам поискать в Google словосочетания. Но так много веб-страниц добавили тот же пример, что теперь — или, по крайней мере, когда мы в последний раз проверяли — Google больше не считает эти «слова» написанными неправильно! Система Google не сопоставляет слова с фактическим словарем, а сравнивает их с часто используемыми словами.)

    Хотите узнать примерную стоимость подержанного автомобиля? Ознакомьтесь с его ценностью в «Синей книге».

    Обратите внимание, что Google предлагает правильное написание, если вы не ввели последнюю букву «е» в слове «синий».

    Поскольку альтернативное написание встречается чаще, Google спрашивает: Возможно, вы имели в виду: синий книжный . Щелкните ссылку с предложенным правописанием, чтобы запустить новый поиск по написанию «синяя книга» вместо исходного «синяя книга».

    Средство проверки Google особенно хорошо распознает часто допущенные опечатки, орфографические ошибки и неправильные представления.Он анализирует все термины в вашем запросе, чтобы распознать, что вы, скорее всего, намеревались ввести. Например, когда вы ищете [ непривязанную статистику ], средство проверки орфографии предлагает . Вы имели в виду: сша . хотя каждое отдельное слово написано правильно.

    Независимо от того, предлагает ли он альтернативное написание, Google возвращает результаты, соответствующие вашему запросу, если таковые имеются. Если нет ни одного, соответствующего вашему запросу, Google может предложить альтернативное написание, советы по поиску и ссылку на ответы Google.Последний — это услуга, которая предоставляет помощь от опытных онлайн-исследователей за определенную плату.

    Google определяет возможные орфографические ошибки и их вероятное правильное написание, используя слова, которые он находит при поиске в Интернете и обработке пользовательских запросов. Таким образом, в отличие от многих корректоров орфографии, Google может предложить общепринятые варианты написания для:

    .
    • Имена собственные (имена и местонахождение)
    • Слова, которых может не быть в словаре

    Люди, которые ищут Бритни Спирс, явно сочли полезной проверку орфографии, поскольку она исправила написание ее имени в диапазоне от «Бретани» до «Приетни».” Посетите archive.google.com/jobs/britney.html, чтобы увидеть сотни других случаев неправильного написания ее имени.

    Имейте в виду, что средство проверки орфографии не может отличить вариант написания от слова или имени, которые пишутся одинаково. Итак, прежде чем нажимать на то, что предлагает Google, убедитесь, что это то, что вы хотели. Например, при поиске веб-дизайнера Mistrale в районе залива Сан-Франциско Google спрашивает: Вы имели в виду: Mistral , хотя я правильно написал имя.

    Упражнения

    Первая задача дает вам возможность попрактиковаться в использовании системы исправления орфографии Google. Советы и ответы на выбранные проблемы см. на странице «Решения».

    1. На Национальном общественном радио (NPR) вы услышали исследователя из Стэнфордского университета, чье имя звучало как Джефф Наумберг, и хотите отправить ему электронное письмо. Какой адрес электронной почты у Джеффа?
    2. На главной странице Google, www.google.com , выполните поиск по запросу «французские военные победы», а затем нажмите кнопку «Мне повезет», чтобы увидеть пародию Albino Blacksheep на результат исправления орфографии Google.

      Примечание: Хотя страница выглядит как страница Google, если вы введете другой запрос в поле поиска, он будет обработан хостинг-сайтом, указанным в адресной строке вашего браузера.

    теги (ключевые слова): запросов, результатов, правописания

    ОРФФОРМАЦИОННАЯ ИСПРАВЛЕНИЕ В ПОИСКОВОЙ СИСТЕМЕ

    Inf Retr Boston. Авторская рукопись; доступно в PMC 2007 13 декабря.

    Опубликовано в окончательной редакции как:

    PMCID: PMC2137159

    NIHMSID: NIHMS22493

    Национальный центр биотехнологической информации, Национальная медицинская библиотека, Бетесда, Национальные институты У.SA

    Корреспонденция: У. Джон Уилбур, Национальная медицинская библиотека, корп. 38А, комн. 6S606, 8600 Rockville Pike, Bethesda, MD 20894, США Телефон 301-435-5926. Факс 301-480-2288. Электронная почта [email protected] См. другие статьи в PMC, в которых цитируется опубликованная статья.

    Abstract

    Известно, что пользователи поисковых систем в Интернете часто вводят запросы с ошибками в одном или нескольких поисковых терминах. Несколько поисковых систем предлагают способы исправления слов с ошибками, но используемые методы являются собственностью и, насколько нам известно, не опубликованы.Здесь мы описываем разработанную нами методологию исправления правописания для поисковой системы PubMed. Наш подход основан на модели зашумленного канала для исправления орфографии и использует статистику, собранную из пользовательских журналов, для оценки вероятности различных типов правок, которые приводят к орфографическим ошибкам. Обсуждаются уникальные проблемы, возникающие при корректировке запросов поисковых систем, и описываются наши решения.

    Ключевые слова: модель зашумленного канала, журналы пользовательских запросов, обнаружение несловных ошибок, trie, расстояние редактирования .2001 г.; Ван, Берри и др. 2003). Ван и др. (2003) сообщают о 26% случаев орфографических ошибок в словах на академических сайтах. Вполне возможно, что количество ошибок на общедоступных сайтах может быть еще выше. Нордли (1999) отмечает, что две трети первоначальных запросов не достигают своей цели, а опрос NPD (2000) показывает, что в 77% случаев первоначально неудачный поиск модифицируется и повторяется на том же сайте. Эти результаты предполагают потенциальную выгоду от выполнения некоторой коррекции запроса для пользователя.Орфографическая коррекция — очевидный кандидат на эту роль. Поэтому мы взялись изучить, как можно построить такое средство для поисковой системы PubMed. PubMed, служба Национальной медицинской библиотеки, предоставляет доступ к более чем 16 миллионам цитат MEDLINE за период с 1950 г., а также к дополнительным журналам по биологическим наукам (McEntyre and Lipman 2001).

    Исправление орфографии было предметом исследований в течение многих лет, и проблема была удобно разделена на три подзадачи (Кукич, 1992; Джурафски и Мартин, 2000) в порядке возрастания сложности: 1) обнаружение несловных ошибок; 2) исправление ошибок в отдельных словах; и 3) контекстно-зависимое исправление ошибок.Каждая из этих задач имеет отношение к проблеме исправления орфографии в поисковой системе, и каждая задача подлежит некоторым особым рассмотрениям в этой настройке. Обнаружение несловных ошибок обычно выполняется путем сравнения строки со списком допустимых слов в каком-либо словаре. В настройках поисковой системы словарный запас, потенциально доступный для поиска, служит словарю. Для целей данной статьи давайте будем называть этот словарь словарем базы данных. Если термин отсутствует в базе данных, то для практических целей поиска данных можно предположить, что он написан с ошибкой.Если термин просто имеет низкую частоту в базе данных, он все еще может иметь высокую вероятность того, что он является орфографической ошибкой, и мы можем принести пользу пользователю, предложив термин с более высокой частотой в качестве исправления. Если запрос состоит из одного слова, мы имеем дело со случаем исправления ошибок в отдельных словах. С другой стороны, если запрос состоит из двух или более слов, существует вероятность того, что мы имеем дело с полезным контекстом, который может помочь процессу исправления. Однако запросы обычно состоят не более чем из двух-трех слов (Сильверштейн и Хензингер, 1999), поэтому контекст будет в лучшем случае небольшим, а в худшем — бесполезным.В этой ситуации необходимо разработать стратегию, позволяющую использовать контекст там, где он полезен, и игнорировать его в противном случае. Типичный и практичный подход к использованию контекста при исправлении правописания состоит в том, чтобы применить языковую модель к рассматриваемому жанру текста и использовать ее для улучшения предсказания исправленной строки (Черч и Гейл, 1991; Кукич, 1992; Брилл и Мур, 2000). ; Джурафски и Мартин, 2000). Наш подход похож на языковую модель в том смысле, что когда нам предъявляют запрос из более чем одного слова, мы пытаемся исправить фразу, которая распознается механизмом запросов, и частота этой фразы вступает в игру в процессе.

    Наш основной подход представляет собой форму модели зашумленного канала для исправления правописания, которая очень похожа на метод, разработанный Черчем и Гейлом (1991). Основное отличие состоит в том, что мы включили букву контекста по обе стороны от предполагаемой поправки при вычислении ее вероятности. В этом мы движемся в направлении, взятом Бриллом и Муром (2000), только мы не допускаем столько контекста, сколько их подход. Модель зашумленного канала пытается вычислить выражение

    , где s представляет собой строку, подлежащую исправлению, а w — потенциальную коррекцию.В нашей реализации w работает со словарем базы данных поисковой системы, а P ( w ) представляет вероятность того, что пользователь намеревался выполнить поиск, используя слово w . Мы следуем Черчу и Гейлу (1991) в оценке P ( s|w ) как произведения вероятностей правок, необходимых для преобразования w в s . Одна из трудностей при построении нашего алгоритма коррекции заключалась в получении полезных контекстно-зависимых оценок этих вероятностей редактирования.Наше решение включает в себя сбор статистики из журналов поисковых систем.

    Документ состоит из следующих разделов:

    • Сбор статистики редактирования – Как мы определяем вероятности редактирования из журналов запросов пользователей PubMed.

    • Основные предположения метода – Как мы интерпретируем модель зашумленного канала в настройках PubMed.

    • Алгоритм: основные функции – Четыре основные функции редактирования, применяемые к строкам в зависимости от их характеристик.

    • Алгоритм – Как сочетаются основные функции редактирования для обработки строк из одного, двух или более токенов.

    • Очистка данных PubMed – Как мы снижаем рейтинг неправильных написаний в словаре поисковой системы PubMed с помощью статистического тестирования.

    • Проблемы с производительностью — Цифры, описывающие текущую реализацию алгоритма и его производительность.

    • Обсуждение – Успехи и неудачи алгоритма и способы его улучшения.

    • Выводы.

    Прежде чем мы пойдем дальше, несколько слов о терминологии. Под терминами «слово» или «токен» мы будем подразумевать одно и то же, а именно строку печатных символов ASCII, не содержащую пробелов внутри строки. Термины «слово» или «токен» обычно используются взаимозаменяемо (Jurafsky and Martin 2000). Таким образом, «дом» — это слово или токен, как и «ххххх», хотя обычно мы не можем думать о «ххххх» как о слове. Мы также будем использовать слова «термин» и «фраза» взаимозаменяемо для обозначения строки, состоящей из одного или нескольких слов или токенов, разделенных пробелом.Опять же, это обычное использование.

    СБОР СТАТИСТИКИ РЕДАКТИРОВАНИЯ

    Хотя исправление орфографии не было в центре внимания, ряд исследователей изучили методы анализа журналов пользовательских запросов для поисковых систем с целью внесения полезных предложений по улучшению запроса пользователя. Биферман и Бергер (Beeferman and Berger, 2000) кластеризовали запросы на основе данных о кликах, которые показывают, какие записи на самом деле выбирает пользователь. Когда разные запросы приводят к щелчку одной и той же записи, это считается сходством между запросами.Вен и др. (2002) используют данные «кликабельности», а также показатель лексического сходства двух запросов для одной и той же цели. Такие методы могут использоваться для предложения терминов из одного запроса в дополнение к запросу, который был найден рядом с ним в «пространстве кликов». Лерой и др. (2003) используют текст «нажатие», а не запись «нажатие на», и анализируют слова в тексте, на который нажали, в качестве источника для дополнения запросов пользователя. Хуанг и др. (2003) изучают пары терминов, которые одновременно встречаются в сеансе одного пользователя в веб-журналах, чтобы обнаружить отношения, которые можно использовать для предложения новых терминов для добавления к запросу пользователя.Хотя ни одно из этих исследований не направлено на исправление правописания, все же есть некоторые сходства.

    Мы анализируем журнал запросов, чтобы обнаружить сеансы отдельных пользователей, содержащие пары терминов, которые мы идентифицируем как термин запроса и его исправление. Один сеанс пользователя определяется одним IP-адресом и условием запроса, и его исправление должно происходить в течение 300 секунд друг от друга. 300-секундный порог оказался полезным (Silverstein and Henzinger 1999; Huang, Chien et al. 2003). Данные показывают, что несколько пар запросов, разделенных более чем 300 секундами, поступают из одного и того же сеанса (Huang, Chien et al.2003). Мы анализируем эти пары терминов запроса, чтобы использовать их не как прямое руководство по исправлению запросов, а для получения статистики правок, приводящих к ошибкам. Метод идентификации таких пар зависит не только от одного и того же IP-адреса и почти параллелизма во времени, но также от меры близости между словами запроса. Для этой цели мы используем монтажное расстояние в один, два или самое большее три редактирования. Мы также настаиваем на том, чтобы при наличии нескольких правок разные правки разделялись хотя бы одним символом, чтобы можно было определить правильный контекст для каждой правки, а сама правка не вызывала вопросов.Мы обосновываем это на основании первоначального наблюдения Damerau (1964) о том, что 80% орфографических ошибок вызваны единичным редактированием (удалением, вставкой, заменой или транспозицией). Мы не утверждаем, что более сложных операций редактирования не бывает, но мы пытаемся аппроксимировать их комбинацией отдельных правок.

    Наше заявление о том, что собранные нами данные представляют собой орфографические ошибки, подтверждается тем фактом, что если найти термин в журналах запросов, которого нет в базе данных PubMed, и посмотреть на термины, поступающие из запросов того же пользователя, предшествующих или следующих за во времени и близкие в лексическом пространстве, гораздо более вероятно, что такие термины следуют, чем предшествуют во времени.Это видно из того, где очевидно, что при условии, что термин запроса отсутствует в базе данных PubMed, гораздо более вероятно найти потенциальное исправление, происходящее после термина, чем до него. Мы считаем, что единственное разумное объяснение этому наблюдению состоит в том, что эта асимметрия указывает на то, что люди постоянно вносят исправления в ошибочные запросы, чтобы получить совпадения в базе данных. Тот факт, что некоторые правильные термины появляются перед их ошибочными аналогами, мы приписываем тому факту, что люди нередко набирают термин правильно, а затем вынуждены его повторять и могут сделать опечатку при второй попытке, которой не было при первом наборе.Тем не менее, мы предпочитаем доверять исправлению, которое следует за термином запроса. полностью основан на словах запроса, которых нет в базе данных PubMed. Однако есть также убедительные доказательства того, что люди исправляют не только термины, которых нет в PubMed, но также исправляют термины, которые просто встречаются с низкой частотой в данных PubMed. Это показано в . Здесь мы видим, что в частотном диапазоне от 1 до 100 терминов запроса, по крайней мере, на порядок более вероятно, что за ними следует высокочастотный лексически близкий термин, чем им предшествует такой термин.Опять же, асимметрия свидетельствует о родстве таких пар терминов запроса и о том, что второй термин в паре присутствует как поправка для первого термина.

    Сплошная кривая представляет количество пар терминов запроса, в которых термин, содержащийся в базе данных PubMed, следует за термином, отсутствующим в базе данных. Ломаная кривая представляет те же данные, когда термин, содержащийся в PubMed, предшествует термину, которого не было в базе данных. Во всех случаях термины находятся в пределах трех правок друг от друга.

    Количество терминов запроса с разной частотой в данных PubMed, за которыми следует лексически близкий термин с десятикратной частотой (сплошная кривая) или предшествующий близкий термин с десятикратной частотой (пунктирная кривая).

    Наши данные являются результатом сбора таких правок, которые мы описали в файлах журналов PubMed за 63 дня. Мы собрали около 1 миллиона правок, как указано в . Все термины многократного редактирования должны были содержать как минимум в четыре раза больше символов, чем правки, чтобы гарантировать, что правки действительно будут исправлениями.Это в дополнение к условию, согласно которому исправления в PubMed встречаются как минимум в десять раз чаще, чем термины, которые они должны исправлять.

    Таблица 1

    Ошибки, собранные за 63 дня пользовательских журналов PubMed.

    6
    Количество ошибочных слов Общее количество редактирования
    1 Ошибка редактирования 769128 (87%) 769128
    2 Ошибка редактирования 105860 (12%) 211720 211720
    3
    3 Ошибка редактирования 4932 (1%) 4932 (1%) 14796
    Всего 879920 99

    Собранные данные были собраны с одной буквой контекста по обе стороны от редактировать.И начало, и конец слова были отмечены специальными символами, чтобы они также могли функционировать в качестве контекста и сделать процесс исправления специфичным для начала и окончания слов соответственно. Можно заметить, что наши данные показывают, что 87% всех слов с ошибками являются результатом одной ошибки редактирования. Это несколько выше, чем цифра 80%, наблюдаемая Damerau (1964), но согласуется с нашим требованием, чтобы множественные ошибочные правки происходили с буквой контекста, разделяющей их.Это естественным образом уменьшает количество видимых ошибок более высокого порядка.

    ОСНОВНЫЕ ПРЕДПОЛОЖЕНИЯ МЕТОДА

    Для оценки выражения (1) мы должны иметь не только информацию о вероятности правок. Мы также должны уметь оценивать априорные вероятности P ( w ). Это вероятности того, что различные слова, встречающиеся в базе данных PubMed, будут использоваться пользователями в качестве терминов запроса. Мы изучили термины, встречающиеся в базе данных PubMed, и обнаружили, что они используются в качестве терминов запроса прямо пропорционально их частоте в базе данных.Это показано в том месте, где прямая линия указывает на прямую пропорциональность. Линия несколько зашумлена на высоких частотах из-за разреженности данных и имеет небольшой изгиб на низких частотах, что указывает на то, что на самых низких частотах в запросах используется меньше терминов. Мы ожидаем такого отклонения из-за того, что миллионы очень низкочастотных терминов, как правило, неизвестны большинству пользователей. Таким образом, мы можем использовать частоту термина в базе данных в качестве суррогата вероятности того, что этот термин будет предназначен как термин запроса, введенный пользователем, при условии, что мы сбрасываем значение на низких частотах.На самом деле наше дисконтирование на низких частотах более резкое, чем изгиб кривой, потому что на этих низких частотах большая часть того, что вводят пользователи, является орфографической ошибкой, а не тем, что они намеревались. Мы дисконтируем по формуле

    Термины запроса группируются по логарифму (частота запроса) по оси x, а среднее значение журнала частоты MEDLINE по каждому бину откладывается по оси y.

    F 3′ 3 ‘4 = F * 10 F * ( F * ( F -80) , F <80

    (2)

    , где F — это оригинальная частота базы данных и f ′ дисконтированная частота.Таким образом, наше первое основное предположение заключается в том, что мы можем позволить частоте термина в базе данных стоять на месте P ( w ) в (1) при условии, что мы применяем дисконтирование, заданное (2).

    Наше второе основное предположение заключается в том, что люди чаще делают орфографические ошибки при составлении запросов, чем при составлении текста для базы данных PubMed. Это подтверждается приведенными во введении данными о частоте орфографических ошибок в поисковых запросах (до 26%) по сравнению с данными о частоте орфографических ошибок в печатном тексте менее 5% (Кукич, 1992).Печатный текст, который появляется в PubMed, обычно подвергается редакционному процессу, и во многих случаях также применяется автоматическая проверка орфографии. Кроме того, печатный текст часто является продуктом усилий нескольких авторов, и по этой причине можно ожидать, что в нем будет меньше орфографических ошибок. Таким образом, мы считаем, что наше предположение не является необоснованным. Мы используем это предположение, чтобы решить, когда исправлять слово, которое уже есть в базе данных. Предположим, что s — это слово, которое появляется в базе данных, а w — это слово, определенное вычислением выражения (1) для s .Затем, чтобы решить, должны ли мы предложить w в качестве поправки на s , мы спрашиваем, выполняется ли неравенство

    . Если s является в первую очередь опечаткой w , мы могли бы ожидать равенства в (3) при условии, что P ( s|w ) оценивается на основе частоты ошибок, преобладающих в базе данных PubMed. В этом случае, когда мы оцениваем P ( s|w ) на основе более высоких коэффициентов ошибок, полученных из пользовательских журналов, мы ожидаем, что неравенство (3) будет выполнено.Если это так, мы принимаем это как свидетельство того, что s , вероятно, является опечаткой w . Конечно, только неравенство (3) само по себе дает основание для предложения w в качестве поправки на s , потому что левая часть неравенства представляет собой вероятность того, что пользователь намеревался s в качестве термина запроса, а правая часть есть вероятность того, что пользователь намеревался ввести w в качестве термина запроса, но из-за внесения ошибок получил s .При фактическом применении (3) мы заменяем частоты базы данных с и с на вероятности P ( с ) и P ( с ) и используем дисконтирование в (2 ) там, где это уместно.

    Чтобы применить формулы (1) и (3), мы должны также оценить вероятность, P ( s|w ), что при попытке произвести w будут внесены ошибки, которые фактически дадут s Обычно мы следуем методу «выравнивания максимальной вероятности» или «минимального расстояния редактирования», как описано в Jurafsky and Martin (2000).Мы оцениваем P ( s|w ) как произведение вероятностей последовательности правок, которая даст s из w . Поскольку таких последовательностей часто бывает несколько, мы берем последовательность, дающую наибольшую вероятность, в качестве нашей оценки для P ( s|w ).

    АЛГОРИТМ: ОСНОВНЫЕ ФУНКЦИИ

    Здесь мы начнем описание алгоритма с описания того, как выполняется исправление орфографии на самом базовом уровне.Наша цель состоит в том, чтобы предложить исправление только в том случае, если мы можем сделать это с гарантией того, что наше предложение будет правильным как минимум в 70% случаев. Это требование в некоторой степени влияет на то, как строятся основные функции. Предположим, что s — это строка, которую необходимо исправить.

    OneDit

    Мы оцениваем P ( S ) и P ( S | W ( S | W ) P ( W ) по всем W в базе данных, которые находятся в пределах одного редактирования с .Это делается путем использования частот базы данных (с соответствующим дисконтированием) и редактирования вероятностей, а затем нормализации полученных оценочных значений до единицы. Пусть c обозначает термин с наибольшей оценочной вероятностью, а P c обозначает эту вероятность. Если P c >0,7 или P ( s ) <0,05 принять c в качестве коррекции. В противном случае не предлагайте никаких исправлений. Обоснование предложения c в качестве исправления, когда P ( s ) <0.05 заключается в том, что в этом случае мы можем отклонить на уровне 5% гипотезу о том, что s — это то, что имел в виду пользователь, и мы также должны были дать наше лучшее предположение в качестве исправления. Таким образом, наша стратегия состоит в том, чтобы предложить исправление, если мы совершенно уверены, что мы правы, а также когда мы совершенно уверены, что входная строка не предназначалась, даже если в последнем случае мы можем быть гораздо менее уверены, что исправление является правильным.

    TwoEdit

    Мы оцениваем P ( s|w ) P ( w ) по всем w в базе данных, которые находятся на расстоянии двух правок от s .Если такие строки есть, мы возвращаем наиболее вероятную в качестве принятого исправления. В противном случае коррекция не предлагается.

    RecursiveEdit

    Если бы мы попытались произвести исправление с двумя правками и потерпели неудачу, мы бы произвели выравнивание начального сегмента s с начальным сегментом слова w в базе данных, включающей две правки. Мы можем оценить такие попытки по тому, сколько букв в s они используют. Пусть м обозначает максимальную оценку, полученную при любом таком частичном выравнивании.Затем мы запрашиваем то частичное выравнивание, которое получает рейтинг м и также имеет самую высокую вероятность среди всех таких частичных выравниваний с рейтингом м . Мы называем это лучшим частичным выравниванием. Затем мы можем повторять эту процедуру каждый раз, начиная с лучшего частичного выравнивания, полученного на предыдущей итерации. Если мы требуем, чтобы алгоритм делал некоторое продвижение по строке s на каждом этапе и прерывал процесс, если он терпит неудачу в какой-либо точке, мы получаем алгоритм, который либо производит полное выравнивание, либо завершается, не производя никакого выравнивания только с несколько итераций.Если алгоритм завершается предложением, мы требуем, чтобы результат прошел тест на сходство с s , который мы называем проверкой работоспособности (см. ниже). Если да, то это принимается как поправка. В противном случае коррекция не предлагается.

    StringSplit

    Мы пытаемся ввести пробел в какой-то точке строки, чтобы преобразовать ее в два слова. Если оба результирующих слова найдены в базе данных, они становятся кандидатами на разделение для строки с рейтингом, равным наименьшей из частот в базе данных двух слов, полученных в результате разделения.В случае разделения в качестве исправления может быть предложено разделение с наивысшим рейтингом. Обычно для того, чтобы быть принятым, требуется иметь рейтинг выше некоторого нижнего предела. Если да, то в качестве коррекции предлагается раскол. В противном случае коррекция не предлагается.

    Если такое слово, как «фосфатаза», разделено ошибочным введением внутреннего пробела, как в слове «фосфхатаза», это можно исправить одной операцией редактирования, которая удалит лишний пробел. Таким образом, не требуется никакого специального механизма исправления, кроме функций OneEdit, TwoEdit или RecursiveEdit, описанных выше.Однако, если два слова случайно встречаются вместе, как в слове «яд», операций редактирования может оказаться недостаточно, потому что строка «ядовитый укус» не встречается среди строк, искомых для исправления. Именно по этой причине необходим StringSplit.

    В дополнение к только что приведенным основным функциям мы также используем два типа проверок, чтобы убедиться, что строка не была слишком сильно изменена в процессе исправления. Мы называем это проверками на вменяемость.

    Вменяемость1

    Эта проверка сравнивает первые три символа с и предполагаемое исправление.Если при сравнении символов в позиции 0, символов в позиции 1 и символов в позиции 2 имеется не более одного различия между строками, то исправление проходит этот тест.

    Здравомыслие2

    Этот тест является более обширным тестом, в котором балл засчитывается, если символ заменяется, балл засчитывается, если один или два символа в строке вставляются или удаляются, но транспозициям присваивается нулевая стоимость. Затем сравнивают строку s и предполагаемое исправление, сравнивая первое слово в каждом, второе слово в каждом и т. д.Тест считается пройденным, если в любом таком сравнении встречается стоимость преобразования, не превышающая двух баллов за каждую сравниваемую пару слов.

    Оценка областей успеха

    Хотя функций редактирования OneEdit, TwoEdit и RecursiveEdit достаточно для внесения исправлений в строки, они не одинаково эффективны для строк любой длины. Как правило, чем короче строка, тем сложнее ее исправить. Этому есть две причины. Во-первых, более короткая строка имеет менее полезный контекст, окружающий ошибки, по которым можно идентифицировать предполагаемую строку.Во-вторых, пространство всех струн гораздо более плотно заселено в области более коротких струн (Кукич, 1992). Эта проблема густонаселенного пространства явно является проблемой в базе данных PubMed, где очень много строк, возникающих в виде аббревиатур. Из-за этой проблемы мы проверили производительность функций редактирования с помощью моделирования. Отдельные слова были выбраны случайным образом из базы данных с вероятностью, пропорциональной их частоте в базе данных. После выборки слова одно, два или три редактирования случайным образом вносились в слово с использованием зависящих от контекста вероятностей редактирования, которые мы собрали из пользовательских журналов.Затем была предпринята попытка исправить орфографическую ошибку с помощью функций редактирования. Мы собрали данные в таблицы с подробными результатами для различного количества правок и в зависимости от длины строки, которую алгоритмы должны были исправить. Результаты содержатся в -. Данные показывают, что исправить очень короткие строки очень сложно. На основании этих данных мы не пытаемся исправлять отдельные слова длиной менее пяти или шести. Аналогичным образом предполагается, что для надежного исправления двух правок требуется строка длиной около девяти, и таким же образом предполагается, что для надежного исправления трех правок требуется строка длиной примерно двенадцать.Аналогичные данные можно смоделировать для двухсловных фраз. Мы использовали эти данные при построении нашего алгоритма.

    Таблица 2

    Для разных длин слов показано количество слов, выбранных и отредактированных для получения орфографических ошибок, а также процент таких слов, которые функции пытались исправить, и процент успеха, который они имели, когда было предложено исправление.

    90 524 Таблица 3

    одиночная лексема — одиночный редактировать
    длиной Всего Слова % попыток % успех
    3 +1786 99 24
    4 6701 73 45
    5 10827 88 55
    6 14823 86 72
    7 13511 94 88
    90 524 Таблица 4.

    одиночной лексема — два редактирует
    длиной Всего слова % Ударов % успех
    6 14408 78 13
    7 13460 61 25
    8 11938 96 65
    9 10124 96 80
    10 7974 95 87
    одиночной лексема — три правки
    длина Всего Ошибка % Удары % успех
    9 9485 84 39
    10 7405 70 52
    11 5496 69 67
    12 4000 62 71
    13 2835 59 76
    14 1964 57 80

    новая строка — одна из строк, хранящихся в дереве (Sedgewick 1998).Чтобы эффективно искать наилучшее исправление для строки запроса

    s , как требуется в выражении (1), мы используем древовидную структуру (Кукич, 1992; Брилл и Мур, 2000). Все поисковые термины базы данных загружаются в это дерево. Затем, как указали Холл и Доулинг (1980), доступны два основных подхода. Можно сгенерировать все строки, которые близки (скажем, в пределах одного или двух правок) к строке s , и посмотреть, какие из них находятся в дереве. Или можно попытаться выполнить поиск в дереве напрямую, используя строку s , внося необходимые исправления для получения совпадения.Проблема с генерированием всех строк, близких к s в пространстве редактирования, заключается в том, что будет сгенерировано много бессмысленных строк, которые не представляют интереса, и затем придется искать каждую из них, чтобы увидеть, есть ли она в базе данных. Мы предпочитаем прямой поиск дерева из-за его эффективности. Например, если проследить совпадение первых k букв s в дереве и не расширить это совпадение до k + 1-й буквы, то можно сделать вывод, что в первых должна быть ошибка. k + 1 символ s .Далее не нужно проверять все возможные правки, а только те, которые расширят совпадение в дереве. Это приводит к значительной экономии времени без упущения какой-либо возможной совпадающей строки в дереве.

    Поскольку мы должны исправлять ошибки во фразах переменной длины, мы используем в алгоритме три разных попытки. Во-первых, мы строим тройку Tr123 из всех фраз, состоящих из одной, двух или трех токенов, распознаваемых поисковой системой. Если строка запроса s состоит из одного или двух токенов, мы ищем исправление в Tr123.Это позволяет исправлению иметь больше или меньше токенов, чем запрос. Например, запрос «апоптоз», ошибочно разбитый на две лексемы, даст поправку «апоптоз», состоящую из одной лексемы, а запрос «в-клеточная лимфома», ошибочно объединенный в две лексемы, даст поправку из трех лексем «b». клеточная лимфома». Если строка запроса s состоит из трех или более токенов, мы ищем фразу s ′, состоящую из первых двух токенов в дереве Tr2p. Tr2p — это дерево, содержащее все фразы с одной или двумя токенами, которые являются начальными одной или двумя токенами фраз из трех или более токенов и распознаются поисковой системой.Если мы находим совпадение, даже исправление, мы пытаемся расширить это исправление в дереве Tr3+, которое состоит из всех фраз, состоящих из трех или более токенов, распознаваемых поисковой системой. Например, система не вносит исправления в запрос «доман» (имя человека), но при наличии запроса «домен связывания ДНК» она сначала проверяет, что «связывание ДНК» происходит в Tr2p, а затем расширяет это до исправления «домен связывания ДНК». ” в Тр3+. Таким образом, мы избегаем попытки очень длинного сопоставления, которое было бы дорогостоящим по времени, если только у нас нет доказательств того, что длинное сопоставление возможно на основе начальной части s .Если начальное совпадение s ′ с Tr2p не удается, мы ищем совпадение s ′ с Tr123 и т. д. Таким образом, алгоритм организован вокруг числа токенов, содержащихся в строке поиска s .

    Мы продолжаем давать псевдокод для различных случаев или количества токенов в строке. В дальнейшем мы будем обозначать l ( s ) длину в символах, а f ( s ) обозначать частоту базы данных для любой строки s .Любая строка, отсутствующая в словаре поисковой системы, считается имеющей нулевую частоту в базе данных. Обратите внимание, что мы используем слово RETURN, чтобы сигнализировать об окончании вычисления, когда модуль либо возвращает предложенное исправление, либо нет, но в любом случае все строки, следующие за RETURN до конца модуля, игнорируются. Мы также использовали слово «этап» для обозначения различных частей алгоритма для удобочитаемости, и существует некоторая корреляция в стоимости вычислений с более высокими номерами этапов, коррелирующими с более дорогими вычислениями.

    SingleTokenModule {

    Стадия 1

    ЕСЛИ l ( s ) < 5 THEN RETURN без исправления.

    ЕСЛИ f ( s ) > 1000 ТОГДА ВОЗВРАТ без исправления.

    ИНАЧЕ ЗВОНИТЕ OneEdit для s .

    Этап 2

    IF

    IF R = 0 и L ( S ) ≥ 9, затем

    • Call stringsplit

    • Вызов TweDit для S .

    ИНАЧЕ ЕСЛИ R =1 и l ( c ) ≥ 5 ТОГДА ПОЗВОНИТЕ OneEdit по номеру c .

    Этап 3

    IF R = 1

    R = 1

    R = 2

    R = 2

    Этап 4

    IF L ( S ) ≥ 12 Тогда вызовите рекурсию для S .

    ВЫЗОВ StringSplit.

    ВОЗВРАТ без исправления.

    }

    В качестве примера предположим, что строка запроса «рибонфлавен». Затем, поскольку эта строка имеет длину больше 5 и не встречается в базе данных, SingleTokenModule попытается исправить.На этапе 1 вызывается OneEdit и выдает коррекцию «рибонфлавин», которая встречается в базе данных 1 раз. На этапе 2 для коррекции используется другой OneEdit, который производит «рибофлавин», который встречается в базе данных 7380 раз. На этапе 3 из-за его высокой частоты в базе данных в качестве коррекции возвращается слово «рибофлавин». Этот пример иллюстрирует два основных принципа разработки алгоритма проверки орфографии. Во-первых, небольшие изменения в строке запроса всегда предпочтительнее больших изменений.Во-вторых, изменения, которые приводят к обнаружению слова в данных, всегда более правдоподобны, чем изменения сопоставимой величины, которые этого не делают. Здесь одно редактирование переводит нас из строки «рибонфлавен» в строку «рибонфлавин», которая появляется в данных и, таким образом, может быть в худшем случае опечаткой чего-то в базе данных. Затем еще одно редактирование превращает «рибонфлавин» в высокочастотную строку «рибофлавин». Эта цепочка из двух небольших изменений имеет больше доказательств в поддержку, чем просто запрос результатов TwoEdit.Как правило, решения принимаются на основе правдоподобия результатов, где мы оцениваем правдоподобие по:

    1. Меньшие изменения более правдоподобны.

    2. Изменения, приводящие к созданию строки в базе данных, более правдоподобны, чем изменения того же масштаба, которые этого не делают.

    3. Изменения, которые производят строку с высокой частотой в базе данных, предпочтительнее, чем аналогичные по величине, но не такие.

    Модуль SingleTokenModule следует этим принципам, проходя через этапы в поисках наиболее правдоподобного решения, но постепенно пробуя менее правдоподобные методы, пока либо решение не будет найдено, либо попытка не приведет к исправлению.Все различные методы исправления присутствуют, потому что мы действительно нашли их необходимыми в определенных случаях. В SingleTokenModule (и в других модулях) есть определенные константы, которые были выбраны, потому что они давали разумные результаты в испытаниях. Они были выбраны эмпирическим путем, и формальная оценка не проводилась. Мы вернемся к этому вопросу ниже.

    Весь поиск в SingleTokenModule выполняется в дереве Tr123. То же самое верно и для TwoTokenModule, который мы собираемся описать.Когда нам дают запрос из двух слов, в задачу вводится новый элемент. Это вопрос контекста. Вполне возможно, что одно из слов является правильным и может быть использовано в качестве контекста для более эффективного исправления другого. С другой стороны, эти два слова не обязательно должны быть тесно связаны, как это произошло бы в осмысленной фразе. Таким образом, у нас должна быть стратегия, которая подсказывает нам, когда пытаться использовать контекст, а когда его избегать. Эта стратегия является важной частью общего плана исправления многословия.В следующем псевдокоде мы обозначим запрос с двумя токенами как s _ t , где s и t — это отдельные токены. В дальнейшем мы будем использовать основные функции редактирования, определенные в предыдущем разделе. Однако есть некоторые ограничения, которые мы сочли полезными при редактировании s и t независимо от l ( s _ t ).

    Ограничение1

    Если длина токена меньше трех, не редактируйте его.Допустим, это правильно.

    Constraint2

    Если длина токена меньше семи, внесите в него не более одной правки.

    Эти ограничения применяются к данной лексеме независимо от длины другой лексемы во фразе. Мы считаем, что токены из одного или двух символов вряд ли будут написаны с ошибками, и мы используем их в качестве фиксированных точек, с помощью которых можно направлять процесс исправления.

    TwoTokenModule {

    Этап 1

    IF l ( s _ t )<7 ТОГДА ВОЗВРАТ без исправления.

    Набор f м = мин( f ( s ), f ( t )).

    ЕСЛИ f ( s _ t )>5 и f m >500 ТОГДА ВОЗВРАТ без исправления.

    IF F ( S _ T )> 0 и F M > 50 и L ( S ) ≤ 4 или L ( T ) ≤ 4

    Этап 2

    CALL OneEdit для s _ t и установите R =0.

    ЕСЛИ R =1 ТОГДА ПОЗВОНИТЕ OneEdit по номеру c .

    ЕСЛИ R =0 ТО ВЫЗВАТЬ TwoEdit для s _ t .

    ЕСЛИ R =0 и f m ≥ 100 ТОГДА ВЫЗВАТЬ SingleTokenModule для каждого из s и t отдельно и ВОЗВРАТИТЬ результат.

    ИНАЧЕ ЕСЛИ R =1 и f ( c ) ≥ f m ТОГДА ВЕРНИТЕ c в качестве исправления.

    Этап 3

    стрижки вызовов STRIONSPLIT для S _ T

    IF L ( S _ T )> 20 и F M = 0 или оба L ( s ) ≥ 7 и l ( t ) ≥ 7 THEN

    ВЫЗВАТЬ SingleTokenModule для каждого из s и t отдельно и ВОЗВРАТИТЬ результат.

    }

    В качестве примера действия TwoTokenModule рассмотрим строку запроса «gammg globulin».Эта строка встречается в базе данных только 1 раз, а поскольку «gammg» встречается в базе данных только 2 раза, «gammg globulin» проходит этап 1 обработки и является кандидатом на исправление. OneEdit производит поправку «гамма-глобулин», а повторный вызов OneEdit не приводит к улучшению, поэтому это принимается как окончательная коррекция. Поскольку частота строки изменилась с частоты 2 за одно редактирование до конечной частоты 15 568, исправление имеет высокую вероятность. Теперь рассмотрим строку запроса «академическое отношение».Эта фраза не встречается в базе данных, поэтому проходит этап 1 и становится кандидатом на исправление как фраза. Однако единственное найденное исправление — это строка «академические способности», которая встречается в базе данных 30 раз. Из-за низкой частотности этой фразы она не принимается в качестве исправления. Мы принимаем частоту как меру правдоподобия, и «академический» встречается в базе данных 52 629 раз, а «отношение» — 144 536 раз. Мы сформулируем это как последний принцип правдоподобия при внесении исправлений.

    Псевдокод для SingleTokenModule и TwoTokenModule дает подробное представление о том, как мы обрабатываем одну и две строки токена. Наконец, мы дадим несколько сокращенное описание того, как мы обрабатываем строки с тремя или более токенами. Пусть s _ t _ u обозначает такую ​​строку, где u может обозначать, возможно, более одного токена. Мы делаем несколько шагов:

    1. Мы видим, встречается ли s _ t в Tr2p.Если нет, ищем поправку для s _ t в Tr2p. Поиск такой же, как поиск в TwoTokenModule, за исключением того, что на третьем этапе мы разрешаем RecursiveEdit только в качестве опции, и нам требуется только l ( s _ t )>20 для его применения. StringSplit и двойное применение SingleTokenModule на данном этапе не являются вариантами, поскольку их успех преждевременно исключит другие предпочтительные варианты. Используется более слабое условие для применения RecursiveEdit, поскольку результат не будет окончательным до тех пор, пока не будет получено более длинное совпадение (с большим количеством контекста).

    2. Если в I мы найдем s _ t или поправку на s _ t в Tr2p, то мы попытаемся расширить это начальное совпадение до совпадения 0 4 5 0 4 5 905 s 6 _ _ _ u в Tr3+. Для этого расширения мы используем форму RecursiveEdit. Если это дает совпадение, которое проходит Sanity2, мы принимаем это как поправку для s _ t _ u и делаем. Если это не дает совпадения, мы пытаемся отказаться от решения, чтобы найти совпадение в Tr3+, которое не включает все s _ t _ u и проходит Sanity2.Если это возможно, выполняется выравнивание исправления с исходной строкой запроса, чтобы определить, какая часть строки остается для исправления. Затем мы принимаем частичное исправление и рекурсивно вызываем процесс для исправления оставшейся строки.

    3. Если I находит совпадение или исправление c в Tr2p, но II не дает совпадения в Tr3+, и если c состоит из единственной лексемы, мы пытаемся расширить это до совпадения в Tr123. Если это удается и совпадение проходит Sanity2, мы принимаем это как исправление и снова должны найти любую оставшуюся строку для соответствия, как в II.

    4. Если в I-III не достигается даже частичное решение, то пытаемся найти поправку для s _ t в Tr123. Это делается путем применения TwoTokenModule, опять же с небольшими изменениями. Модификаций две. Сначала на этапе 2 с высоким пределом частоты, а затем снова на этапе 3 с более низким пределом с помощью StringSplit делается попытка разделить s _ t . Если это успешно, первая часть разделения принимается как часть исправления, и процесс вызывается рекурсивно для второй части разделения и любых оставшихся токенов за его пределами.Во-вторых, если ничего не помогает, то SingleTokenModule вызывается только для s , и результат принимается как частичное исправление (или, возможно, без исправления), и процесс вызывается рекурсивно для исправления t _ u .

    На примере мы иллюстрируем важность контекста при наличии трех или более токенов. Рассмотрим строку запроса «амитрофический латеральный слерсос». Первые два маркера сначала исправляются на «боковой амиотрофический», а затем система пытается расширить его, исправляя «слерсос».В этой последней строке «slersos» всего семь символов, и три ошибки обычно затруднили бы ее исправление, но здесь есть несколько строк, начинающихся с «амиотрофического латерального», отличного от правильного, и поэтому система легко исправляет «slersos» на « склероз». Благодаря исходным токенам, которые обеспечивают контекст, мы можем ослабить ограничения (Constraint1 и Constraint2) в процессе расширения.

    В качестве заключительного комментария к построению алгоритма отметим, что в OneTokenModule и TwoTokenModule и менее заметно при обработке строк запроса из трех и более токенов есть ряд параметров.Эти параметры были выбраны эмпирическим путем, наблюдая за работой алгоритма на запросах, поступающих в поисковую систему PubMed, и внося коррективы. Мы не утверждаем, что включенные здесь варианты являются оптимальными. На самом деле один из сложных вопросов состоит в том, чтобы определить, что должно означать оптимальное в такой обстановке. Можно предположить критерий максимизации числа разумных предложений правописания. С другой стороны, конечной целью является угодить пользователям и оптимально облегчить их поиск.С этой точки зрения за неверные или даже нелепые предложения приходится платить. Если пользователи не верят в разумность предложений, они могут быть менее склонны их использовать. Наш подход был несколько консервативным в попытке избежать предложений с высоким риском и достичь высокой степени точности, а не общего максимального количества разумных предложений с более низкой степенью точности. Другими словами, мы больше заботились о точности, чем о воспроизведении.

    Это завершает описание алгоритма.

    ОЧИСТКА ПУБЛИКУЕМЫХ ДАННЫХ

    Как правило, слова с ошибками в базе данных PubMed встречаются редко, и именно это свойство позволяет корректировать орфографию на основе словарного запаса базы данных. Тем не менее, некоторые термины написаны с ошибками или, по крайней мере, не оптимальны в качестве терминов запроса, которые относительно часто встречаются в PubMed. В связи с этим мы взялись попытаться разобраться с этой проблемой. Мы изучили все фразы из одного и двух слов, которые встречались по крайней мере в пороговом количестве документов в PubMed, а также были одним изменением другого термина в PubMed, частота которых в базе данных была как минимум в десять раз выше.Мы сделали предположение, что если два таких термина имели значительную тенденцию встречаться в одном и том же контексте, то член пары с более низкой частотой был написан с ошибкой или, по крайней мере, неоптимальной версией термина с более высокой частотой. Для терминов с одним токеном мы использовали порог низкой частоты 20. Для терминов с двумя токенами, которые встречаются реже, мы использовали порог низкой частоты 9. Важным соображением при выборе порога низкой частоты является просто иметь достаточно данных, чтобы позволить вычисление достоверной статистики.Мы сочли полезным обрабатывать случаи с одним токеном и двумя токенами несколько по-разному, а также в том, как они были протестированы.

    Одиночный токен

    Предположим, что пара терминов, разделенных одним редактированием, представлена ​​как T 1 и T 2 . Затем мы применяем тест, основанный на гипергеометрическом распределении (Larson 1982). Ситуация проиллюстрирована в . Мы вычисляем p -значение, которое два термина могли бы встречаться одновременно в количестве документов, в которых они встречаются или более, если бы эти два термина были только случайными в их отношении друг к другу.Мы нашли в базе данных 62 720 пар, которые удовлетворяли требованиям по частоте и отличались одним редактированием. Когда был применен только что описанный гипергеометрический тест, результат составил 10 922 пары отдельных токенов, которые были связаны с p — значением менее 0,01. Это означает, что мы можем ожидать, что 99% этих пар терминов будут значительно связаны между собой. Пример таких пар показан на . В большинстве случаев низкочастотный член пары является орфографической ошибкой. В некоторых случаях это просто неоптимальный термин запроса, поскольку существует гораздо более частотный термин с практически таким же значением для целей поиска.

    В пространстве всех документов прямоугольник представляет документы, содержащие термин T 1 , а маленький эллипс — набор документов, содержащий термин T 2 . Пересечение этих двух наборов представляет собой перекрытие, представленное I . Статистическая значимость этого перекрытия может быть вычислена как вероятность того, что это перекрытие столь же велико или больше, чем реально наблюдаемое, если предположить, что эти два термина связаны не более чем случайным образом.Это известно как значение p , и его можно оценить, применяя гипергеометрическое распределение.

    Таблица 5

    Слева приведены некоторые относительно распространенные слова, а справа исправления, предложенные гипергеометрическим тестом. Во многих случаях слова слева написаны с ошибками.

    Неоптимальные термины и частоты корректировки & частот
    acetycholine 153 ацетилхолина 46852
    acetycholinesterase 32 ацетилхолинэстеразы 13207
    acetyglucosamine 20 ацетилглюкозамина 4995
    ацетилирования 287 ацетилированный 6594
    ацетилхолина 64 ацетилхолина 46852
    ацетилцистеин 64 ацетилцистеин 3879
    Acetylocholine 20 Acetylcholine 46852
    AcetylsalicyCliciclic 157 Acetylsalicylic 5186
    Achalasic 905 36 73 ахалазии 2955
    achatin 27 Achatina 320
    дружнее 42 достиг 179735

    два маркера

    В этом случае мы нашли 11 762 пары двух токеновых фраз, которые удовлетворяли требованиям частоты.Сначала мы применили критерий гипергеометрической значимости, как и в случае с одним токеном. Это привело к идентификации 1836 пар, которые были значительно связаны между собой. Если гипергеометрический тест не показал значимость на уровне 0,01, мы применяли более строгий тест. Используемые конструкции изображены там, где мы описали случай пары фраз «инфаркт миокарда» и «инфаркт миокарда». Эти две фразы различаются только своими вторыми словами, и мы использовали общее первое слово «миокардиальный» для определения контекста или набора интересующих документов.

    Мы применяем наивное байесовское обучение, чтобы узнать разницу между положительным набором, помеченным G , и отрицательным набором, состоящим из объединения наборов, помеченных B1 и B2 . Из изученных весов мы получаем как B1 , так и B2 и ранжируем объединение двух наборов. Затем мы применяем тест WMW, чтобы узнать, выше ли сумма рангов элементов B1 , чем можно было бы ожидать на случайной основе. Для ответа на этот вопрос вычисляется значение p .

    В этом наборе набор документов, содержащих неправильное написание «инфаркт миокарда», соответствует прямоугольнику, а набор, содержащий правильную фразу «инфаркт миокарда», соответствует эллипсу. Мы случайным образом выбрали три набора: B1 из документов, содержащих фразу с ошибкой, G из документов, содержащих правильную фразу, но без фразы с ошибкой, и B2 из документов, не содержащих ни одной фразы, но содержащих слово «миокард».Каждый из этих наборов состоял из тысячи случайно выбранных документов, если это число попадало в выбранную категорию. Если набор доступных документов был меньше одной тысячи, за образец брался весь набор. Выборка использовалась для ограничения количества вычислений, необходимых для оценки любой пары фраз. Затем мы применили наивное байесовское обучение, чтобы узнать разницу между G и B1 B2 . С полученными таким образом весами мы оценили все документы в B1 B2 и расположили их в порядке убывания количества баллов.Затем мы применили критерий Уилкоксона-Манна-Уитни, чтобы увидеть, была ли сумма рангов членов B1 меньше ожидаемой. Это означало бы, что члены B1 набрали больше очков, чем ожидалось, или, другими словами, были более похожи на членов G , чем члены B2 . Мы применили этот тест к 9926 парам, оставшимся после удаления 1836 пар, найденных с помощью гипергеометрического теста. В результате мы определили еще 5628 пар фраз, которые были значимы на уровне 0.01 уровень. Пример найденных таким образом пар фраз приведен в .

    Таблица 6

    Образец менее чем оптимальных фраз запроса слева в паре с их гораздо более частотными аналогами справа. В некоторых случаях фраза слева содержит орфографическую ошибку. В других случаях это просто не самая часто используемая форма и, следовательно, будет относительно плохой запрос на используемую концепцию.

    915 05 10
    Неоптимальные термины и частоты корректировки & частот
    мышечной оболочки кишечника нейронных 9 нейронов мышечной оболочки кишечника 593
    myocardiac миокарда 34 инфаркт миокарда 114638
    инфаркт миокарда 122 инфаркт миокарда 114638
    миокарда ишемическая 870 ишемия миокарда 27214
    миокарда некрозы 77 некроза миокарда 2055
    Revascularisation миокарда 234 234 Revassulation миокарда 7343
    Myogenic Expression 10 MyOgenin Expression 119 1
    Myopia Astigmatism Миопский астигматизм 276 276 276 276
    Пациенты миопии 19 Миопские пациенты 231

    10 922 Пары одиночных токенов и 764 Два пар токена полностью не удаляются от рассмотрения.Скорее их частоты уменьшены до единицы для целей вычислений, включающих выражения (1) и (2). Таким образом, гораздо более вероятно, что они не будут выбраны в качестве исправления для запроса. Однако они остаются возможными промежуточными шагами в последовательности операций, ведущих к исправлению. Если они появляются в качестве такого промежуточного звена, шансы на то, что окончательной коррекцией будет высокочастотный член, с которым они связаны в только что описанном статистическом тестировании, возрастают.

    Можно спросить, почему мы не использовали тест WMW для пар одноточечных фраз. Причина в том, что мы обнаружили много ложных срабатываний, когда пытались его использовать. Наша попытка включала изображение, похожее на . Однако у нас не было контекстного слова, подобного слову «миокардиальный», на этой картинке, чтобы сфокусировать вычисления. Поэтому мы выбрали B2 из всех оставшихся данных PubMed, за исключением тех документов, которые включали один из интересующих токенов. Тогда, если бы низкочастотный токен в паре не был орфографической ошибкой, образец B1 был бы из значимой темы, совершенно не связанной с G.В результате документы в B1 могли быть более или менее связаны с G, чем общая случайная выборка B2. Если бы они были более связаны, статистический тест мог бы быть легко удовлетворен на уровне 0,01, и все же не было бы действительно значимой связи между B1 и G . Таким образом, мы отказались от усилий. Возможно, таким образом можно было бы использовать некоторое уточнение теста. Если это так, то он может оказаться весьма полезным, потому что нельзя ожидать, что гипергеометрический тест будет работать во всех важных случаях.Это верно, потому что, когда опечатка действительно появляется в документе, это может быть постоянной ошибкой, и правильно написанный термин может не отображаться. В таких случаях тест на основе контекста, такой как тест WMW, который мы использовали, имеет гораздо больше шансов обнаружить ошибку.

    ПРОБЛЕМЫ ПРОИЗВОДИТЕЛЬНОСТИ

    Для базы данных PubMed попытки, используемые в алгоритме исправления правописания, в настоящее время включают 14 267 366 строк с одним, двумя и тремя маркерами в Tr123; 2 775 111 строк из трех и более токенов в Tr3+; и 1 772 383 начальных сегмента строк из Tr3+ в Tr2p.В обычный рабочий день механизм запросов PubMed получает примерно 3 миллиона пользовательских запросов, и это генерирует более 3 миллионов запросов к алгоритму проверки орфографии. Это связано с тем, что многие запросы являются сложными и включают разбор знаков препинания и логических операторов, в результате чего создаются и проверяются на орфографию несколько фрагментов. Алгоритм проверки орфографии на самом деле предлагает исправления примерно для 10% пользовательских запросов, но любое произведенное предложение проверяется на предмет публикации (если он извлекает какие-либо документы из базы данных).Любое исправление, которое не публикуется, игнорируется. В результате пользователю предлагается исправить около 7% пользовательских запросов. Когда мы впервые начали делать предложения пользователям, они принимались ими в 36% случаев. Примерно через шесть месяцев пользователи принимали предложения со скоростью 40%. Теперь, примерно через год после развертывания, в последний понедельник было 3 275 624 запросов к поисковой системе PubMed, и 243 853 предложения заклинаний PubMed были сделаны для 80 785 уникальных IP-адресов, а 109 526 (45%) предложений заклинаний были нажаты с 45 285 уникальных IP-адресов.

    Был изучен небольшой набор пользовательских запросов, 1323, и 110 из них содержали предложения, сделанные алгоритмом проверки орфографии. Из 110 предложенных исправлений 96 были признаны двумя судьями (совместно проконсультировавшимися) хорошими и 14 плохими. Это 87% успеха с 95% доверительным интервалом (81%,92%). Это намного выше целевого показателя в 70% правильных ответов, к которому мы стремились, и мы полагаем, что отчасти причина этого заключается в том, что предлагаемые исправления, которые не публикуются, игнорируются системой.

    В настоящее время алгоритм проверки орфографии работает на шести компьютерах с процессором Dual Intel Xeon 3,6 ГГц, каждый из которых имеет 6 ГБ ОЗУ. Он написан на C++ и работает под Linux в 64-битном режиме. Его использование увеличило в среднем около 25% времени отклика механизма запросов PubMed, но на практике оно очень мало увеличивает время отклика на правильно написанные запросы. Алгоритм проверки орфографии реализован на шести серверах, потому что сейчас он используется для исправления запросов в четырнадцати различных базах данных NCBI, из которых PubMed просто самая большая.

    ОБСУЖДЕНИЕ

    приводит примеры исправлений, которые алгоритм способен делать. Эти примеры выбраны потому, что они иллюстрируют влияние контекста и некоторые крайности патологии, а не потому, что опечатки типичны. Конечно, не все предлагаемые исправления так хороши, и небезынтересно посмотреть, какие ошибки допущены. Мы рассмотрели чуть более 500 предложений, сделанных программой проверки орфографии, которые не были приняты пользователями, и нашли, по нашему мнению, самые вопиющие ошибки.Они содержатся в .

    Таблица 7

    Примеры фраз, которые может исправить алгоритм проверки орфографии, обрабатывающий запросы PubMed, и предлагаемые исправления.

    Опечатки Коррекция задается алгоритмом
    инфаркт миокарда инфаркт миокарда
    уха нарушение инфекция уха
    miocardi alinfraction инфаркт миокарда
    terminl illnss неизлечимой болезни
    HIG pressue liqud chromatogph высокого давления жидкостной хроматографии
    опухоли necrosisactor фактор некроза опухоли
    Hmgolbin гемоглобина
    Philariosis filariosis

    Таблица 8

    Примеры ошибок алгоритма проверки орфографии при обработке запросов PubMed.

    Фраза Ошибочная коррекция
    Сапна бат саун
    periostin периоды
    Daniel KE danieluk м
    бисексуалов приставать бисексуальных Modest
    поджелудочной железы и трансплантации поджелудочной железы и перевод
    стволовые клеточные поля потерю стволовых клеток
    Checper волос верхний воздух

    можно отметить, что пять из семи фразы, в которых были предприняты две или более попытки редактирования.Тот факт, что «Сапна Бат», имя человека, состоит из двух правок от фразы «баня в сауне», — это просто совпадение, которое не является обычным явлением. Проблема с «периостином» возникает из-за фразы «периоды», которая не должна была быть принята в словарь поисковой системы.

    Проблемы с «Daniel K E» и «ros стволовых клеток» являются следствием того, что мы не применяем Constraint1 и Constraint2 соответственно, когда фраза имеет более двух токенов. Алгоритм мог бы выиграть с точки зрения точности, если бы мы это сделали, но он был бы более сложным.Как для «бисексуальных растлений», так и для «поджелудочной железы и трансплантации» доступный контекст не используется. Это потому, что ни один из них не исправляет фразу в системе. Скорее «перевод» и «приставание» исправляются изолированно. Конечно, слово «приставать» пишется правильно, но в документах PubMed оно встречается только 23 раза, а слово «скромный» встречается более 28 тысяч раз. Можно видеть, что «приставать» более разумно, чем «скромно» из-за другой части запроса, однако в настоящее время система использует контекст только в том случае, если он является частью допустимой фразы в системе.Наконец, есть случай «медных волос». Здесь слово «купер» встречается в PubMed десять раз (на момент написания статьи и не считая поля author). Один раз это имя человека, а остальные девять раз это неправильное написание слова «медь». Алгоритм будет исправлять «медь» на «медь» (более 53 тысяч вхождений), за исключением того, что он предпочитает исправления фраз, когда контекст может более эффективно управлять процессом. Однако на этот раз выдает ошибку. Пользователя вполне могла заинтересовать болезнь Менке, вызванная мальабсорбцией меди в кишечнике и характеризующаяся курчавыми волосами (бесцветными).К сожалению, «медные волосы» не являются признаком болезни Менке, и эта фраза даже не встречается в базе данных PubMed.

    Кто-то может спросить, как наша точность исправления орфографии сравнивается с точностью других, которые использовали модель зашумленного канала. Черч и Гейл (1991) сообщают о точности 87% при исправлении набора из 332 орфографических ошибок, выявленных утилитой Unix Spell , исправление которых было одобрено по крайней мере двумя из трех судей-людей. Все эти орфографические ошибки характеризовались ровно двумя возможными однократными исправлениями в списке слов, составленном исследователями из стандартных источников.Когда модель исправления орфографии была дополнена контекстной информацией через языковую модель, они получили улучшение до 89,5%. Здесь мы можем сказать, что наш показатель точности аналогичен их, хотя есть много вопросов относительно того, насколько сопоставимо тестирование. Во-первых, мы используем не языковую модель, а нечто меньшее, хотя контекст в нашем процессе не полностью игнорируется. Во-вторых, они ограничили свой процесс однократным редактированием, тогда как мы разрешили множественное редактирование. Наконец, они ограничили свое тестирование исправлением, когда в качестве ответов было только два варианта, и это, казалось бы, повысило их точность.Поэтому из такого сравнения трудно сделать выводы.

    Вторая версия модели зашумленного канала для исправления орфографии была предложена Бриллом и Муром (2000). Они используют более сложную модель редактирования, в которой одно редактирование может привести к исправлению нескольких символов. Они также ссылаются на более широкий контекст, чем одиночный символ, предшествующий исправлению, используемому Черчем и Гейлом, или одиночный символ с обеих сторон, который мы используем. Они изучили корпус из 10 000 слов с распространенными английскими орфографическими ошибками в сочетании с их правильным написанием.Они обучили 8 000 из них и протестировали свою систему на оставшихся 2 000. В процессе тестирования они использовали словарь из 200 000 статей, в который вошли все слова из тестового набора. Они обнаружили точность 95% без языковой модели. Чтобы оценить влияние языковой модели, они рассчитали поправки для тех же тестовых слов, которые встречались в контексте в корпусе Брауна. Это привело к показателю точности 95% и соответствующему показателю 93,9% без языковой модели (поскольку результаты вычисляются для каждого токена, а не для каждого типа).Поскольку наша точность коррекции рассчитывается также для каждого токена, именно эти последние цифры наиболее сопоставимы. Они использовали контекст из 3 символов по обе стороны от редактирования в качестве контекста для получения этого результата. Здесь их показатели производительности лучше, чем у нас. Но следует задаться вопросом, как обработка только самых распространенных ошибок в английском языке повлияет на их производительность. Для сравнения, мы имеем дело с полным спектром ошибок, которые могут возникнуть с использованием нескольких токенов, хотя наиболее распространенные ошибки будут иметь наибольшее влияние на нашу точность.Другим фактором, связанным с этим, является размер словаря, используемого в процессе исправления. В нашем случае количество уникальных токенов превышает 2,5 миллиона, а Брилл и Мур используют список из 200 000 слов. Таким образом, наш словарь более чем на порядок больше их. Пока словарь содержит правильные ответы, чем меньше словарь, тем легче процесс исправления. Чем меньше число правильных ответов, тем менее плотно они упакованы (Кукич, 1992) и тем меньше вероятность того, что разные словарные статьи будут конкурировать за исправление строки с ошибкой.

    Из-за различий в способах использования контекста в запросе поисковой системы по сравнению с текстом на естественном языке, а также из-за различий в размере словаря сделать однозначные выводы из этих сравнений непросто. Одна вещь, которая кажется интересной, — это более широкий контекст внутри строки, который Брилл и Мур используют для условия редактирования. Они обнаружили повышение точности примерно на 2% при использовании окна с тремя символами по обе стороны от редактирования вместо окна только с одним символом с каждой стороны.Это говорит о том, что мы могли бы увидеть подобное улучшение, если бы наш алгоритм использовал более широкий контекст. Чего мы не знаем, так это того, как такое изменение повлияет на скорость алгоритма. Этот вопрос требует дальнейшего изучения.

    Другим возможным способом улучшения алгоритма является некоторая форма фонетической коррекции. Признано, что большинство орфографических ошибок (приблизительно 80%) представляют собой единичные ошибки редактирования, когда редактирование понимается в смысле Дамерау (Damerau 1964) вставки буквы, удаления буквы, замены буквы или перестановки. две соседние буквы.Однако фонетические ошибки часто связаны с большим количеством букв и их труднее исправить (Кукич, 1992). Зобель и Дарт (1995) сравнили Soundex и Phonix (Gadd 1990) с методами, основанными на расстоянии редактирования, и пришли к выводу, что методы, основанные на фонетике, уступают подходу на расстоянии редактирования в поиске хороших совпадений для строк в большом словаре. Мы изучили алгоритм Metaphone (Philips, 1990) и попытались использовать его для исправления опечаток в симуляциях, где генерировались ошибки, такие как -. Во всех случаях мы обнаружили, что результаты хуже, чем мы смогли получить, используя модель зашумленного канала и выражения (1) и (2).По нашему опыту, фонетическая коррекция работает хорошо в некоторых случаях, но в других она идентифицирует строки как похожие, которые не должны быть идентифицированы, или не может сделать такую ​​идентификацию, когда мы этого хотим. Например, Зобель и Дарт отмечают, что «безумный» и «не» кодируются в одну и ту же строку в Soundex и Phonix. Аналогичным образом мы отмечаем, что при использовании Metaphone «фаланги» кодируются в «flnjs», а «hpalanges» кодируются в «hplnjs». Таким образом, одна ошибка редактирования может увеличиться при кодировании. Другой вопрос, который следует задать в этой настройке, заключается в том, сколько орфографических ошибок возникает в запросах PubMed, которые нельзя исправить одним или двумя правками.Это важно, потому что наш алгоритм уже достаточно хорошо работает с ошибками, состоящими из одной или двух правок. Чтобы изучить этот вопрос, мы обработали те же 63-дневные файлы журналов пользователей PubMed, из которых мы получили наши вероятности редактирования, и в аналогичной обработке собрали все пары отдельных токенов, где первый член пары не находился в пределах двух правок любой строки в базе данных PubMed, но вторая появилась в базе данных, в то время как две строки производили одну и ту же кодировку в Metaphone (обратите внимание, что мы используем полную кодировку без усечения).Мы идентифицировали 5 781 такое совпадение пар с участием 2 894 уникальных пар. Если кто-то оптимистично предположил, что можно исправить ошибочную строку запроса во всех случаях, используя кодировку Metaphone таким образом, это дало бы не более 92 дополнительных исправлений в день к тому, что мы уже делаем. Учитывая, что мы обычно обнаруживаем, что пользователи принимают более 90 000 исправлений в день, мы ожидаем максимум 0,1% увеличения того, что пользователи принимают, а более реалистично, вероятно, менее половины этого. Таким образом, неясно, стоит ли фонетическая коррекция накладных расходов, которые она повлечет за собой.

    ВЫВОДЫ

    Мы разработали алгоритм проверки орфографии, который выполняет достаточно точную коррекцию (≅87%) и обрабатывает одно или два редактирования, а также большее количество правок, если исправляемая строка достаточно длинная. Он обрабатывает слова, которые фрагментированы или объединены. Если запросы состоят из более чем одного токена, алгоритм пытается использовать дополнительную информацию в качестве контекста, чтобы помочь процессу исправления. Алгоритм реализован в поисковой системе PubMed, где он часто делает более 200 000 предложений в день, и около 45% этих предложений принимаются пользователями.Алгоритм эффективно увеличивает среднее время ответа на запрос для пользователей всего на 25%, и большая часть этого наблюдается только для запросов с ошибками. Существует возможность улучшения алгоритма за счет использования большего количества контекста вокруг мест ошибок в словах. Существует также возможность улучшить алгоритм, научившись лучше использовать контекст, предоставляемый запросами, состоящими из нескольких токенов. В обоих случаях такие усилия должны учитывать, как поддерживать эффективность в свете огромного словарного запаса фраз (> 14 миллионов) и отдельных слов (> 2.5 миллионов) распознается поисковой системой. Существует также возможность использовать фонетическое кодирование для улучшения обработки некоторых ошибок, которые в настоящее время вызывают проблемы в системе. Однако предварительные расчеты показывают, что добиться значительного улучшения с помощью фонетических кодировок будет сложно.

    Благодарности

    Авторы хотели бы поблагодарить Дэвида Кентона и Прамода Парантамана за содержательные обсуждения и их работу по оценке алгоритма, а также Владимира Сиротинина и Гришу Старченко за их работу по включению алгоритма в обработку запросов поисковых систем.Мы также благодарим анонимных рецензентов за полезные предложения по улучшению статьи. Это исследование было поддержано [частично] Программой внутренних исследований NIH, Национальной медицинской библиотеки.

    Ссылки

    • Биферман Д., Бергер А. Агломеративная кластеризация журнала запросов поисковой системы. Шестая международная конференция ACM SIGKDD по открытию знаний и интеллектуальному анализу данных; Бостон, Массачусетс, ACM Press. 2000. [Google Scholar]
    • Брилл Р., Мур Р.С.Улучшенная модель ошибок для исправления орфографии зашумленного канала. ACL 2000 2000 [Google Scholar]
    • Church KW, Gale WA. Оценка вероятности исправления орфографии. Статистика и вычислительная техника. 1991; 1: 93–103. [Google Scholar]
    • Damerau FJ. Техника компьютерного обнаружения и исправления орфографических ошибок. Коммуникации АКМ. 1964; 7 (3): 171–176. [Google Scholar]
    • Гэдд Т.Н. ФОНИКС: Алгоритм. Программа: Автоматизированные библиотечно-информационные системы. 1990;24(4):363–366.[Google Scholar]
    • Hall PA, Dowling GR. Приблизительное соответствие строк. Компьютерные опросы. 1980;12(4):381–402. [Google Scholar]
    • Huang CK, Chien LF, et al. Предложение релевантных терминов в интерактивном веб-поиске на основе контекстной информации в журналах сеансов запросов. Журнал Американского общества информационных наук и технологий. 2003;54(7):638–649. [Google Scholar]
    • Джурафски Д., Мартин Дж. Х. Обработка речи и языка. Река Верхнее Седло; Нью-Джерси, Прентис Холл: 2000.[Google Scholar]
    • Кукич К. Приемы автоматического исправления слов в тексте. Компьютерные исследования ACM. 1992;24(4):377–439. [Google Scholar]
    • Ларсон Х.Дж. Введение в теорию вероятностей и статистический вывод. Нью-Йорк: Джон Уайли и сыновья; 1982. [Google Scholar]
    • Leroy G, Lally AM, et al. Использование динамических контекстов для улучшения случайного поиска в Интернете. Транзакции ACM в информационных системах. 2003;21(3):229–253. [Google Scholar]
    • Макэнтайр Дж., Липман Д.PubMed: преодоление информационного разрыва. Смаж. 2001;164(9):1317–9. [Бесплатная статья PMC] [PubMed] [Google Scholar]
    • Нордли Р. «Раскрытие информации о пользователе» — сравнение первоначальных запросов и последующего развития вопросов при онлайн-поиске и взаимодействии с людьми. SIGIR’99: 22-я Международная конференция по исследованиям и разработкам в области информационного поиска, Калифорнийский университет; Беркли, ACM Press. 1999. [Google Scholar]
    • Филипс Л. Повешение на метафоне. Компьютерный язык.1990;7(12) [Google Scholar]
    • Седжвик Р. Алгоритмы на C (части 1–4) Boston: Addison-Wesley; 1998. [Google Scholar]
    • Silverstein C, Henzinger M. Анализ очень большого журнала запросов поисковой системы. Форум СИГИР. 1999;33(1):6–12. [Google Scholar]
    • Спинк А., Вольфрам Д. и др. Поиск в Интернете: общественность и ее запросы. Журнал Американского общества информационных наук и технологий. 2001;52(3):226–234. [Google Scholar]
    • Опрос. Поиск NPD и обзор сайта портала.2000. Получено 26 сентября 2005 г. с http://www.searchenginewatch.com/sereport/article.php/2162791.
    • Ван П., Берри М.В. и др. Анализ продольных веб-запросов: тенденции и закономерности. Журнал Американского общества информационных наук и технологий. 2003;54(8):743–758. [Google Scholar]
    • Wen JR, Nie JY и др. Кластеризация запросов с использованием журналов пользователей. Транзакции ACM в информационных системах. 2002;20(1):59–81. [Google Scholar]
    • Зобель Дж., Дарт П. Поиск приблизительных совпадений в больших словарях.Программное обеспечение-Практика и опыт. 1995;25(3):331–345. [Google Scholar]

    Проверка орфографии электронной почты | Проверка орфографии электронной почты перед отправкой с помощью электронной почты на Acid


    У маркетологов по электронной почте повсюду есть страшные истории о том времени, когда они отправили электронное письмо с досадной орфографической ошибкой в ​​копии. Или в тот раз в тексте прехедера случайно проскочило ругательство («спросить» — это ведь всего одна буква).

    Конечно, орфографические ошибки не могут иметь решающего значения для кампании по электронной почте, но они могут повлиять на репутацию вашего бренда. В конце концов, эта репутация играет роль в лояльности клиентов, рентабельности инвестиций и успехе организации.

    Вот почему мы рады объявить о запуске нашего нового инструмента проверки правописания электронной почты.

    Новый инструмент проверки орфографии, который вы можете найти в Email on Acid Campaign Precheck, призван сэкономить время маркетологов электронной почты и защитить репутацию их бренда.Он найдет слова с ошибками в вашем сообщении электронной почты и позволит вам исправить их прямо в приложении.

    А вот и кикер: встроенный инструмент проверки орфографии сканирует как видимые, так и невидимые части вашей электронной почты. Он выглядит как копия электронной почты, а также труднодоступные области, такие как замещающий текст, заголовок электронной почты и текст прехедера, что помогает сделать процесс контроля качества электронной почты более эффективным и точным.

    Попробуйте проверить орфографию

    Как это работает

    После того, как вы войдете в свою учетную запись Email on Acid (или зарегистрируетесь для получения бесплатной пробной версии), перейдите на вкладку «Предварительная проверка кампании» в левой части экрана.Если у вас есть HTML-код или URL-адрес электронной почты, добавьте его. В противном случае отправьте тестовое письмо из своего ESP в Campaign Precheck.

    При желании вы можете выбрать конкретный рабочий процесс для использования в Campaign Precheck, например только проверку орфографии. В противном случае вы можете пройти все пять этапов предварительной проверки кампании (доступность, предварительный просмотр прехедера, проверка URL, проверка/оптимизация изображения и проверка орфографии). Узнайте больше о создании и редактировании рабочих процессов .

    Вот как работает инструмент проверки правописания электронной почты:

    1. Сначала мы просканируем вашу электронную почту, чтобы узнать, на каком языке она написана.
    2. Инструмент проверит каждое слово с ошибкой в ​​письме и предложит варианты исправления. Мы также проверим слова на предмет возможной путаницы или опечаток, например ненормативной лексики. У вас будет возможность проигнорировать ошибку, проигнорировать все или заменить предложенное слово.
    3. Если вы решите изменить слово на месте, мы продолжим и обновим ваш код для вас — не нужно возвращаться в HTML, чтобы внести изменения. Если предложенное слово не то, что вы ищете, вы можете ввести слово вручную (мы все равно обновим ваш код).
    Сообщение об инструменте проверки орфографии Acid. Он проверит вашу видимую копию, а также невидимый текст, например замещающий текст изображения (нажмите, чтобы увеличить его).

     

    Еще не все

    Мы рады предложить эту новую функцию проверки орфографии — сегодня ее нет ни в одном другом инструменте контроля качества электронной почты. Но это только начало.

    В ближайшие недели и месяцы мы будем работать над улучшением и расширением нашего инструмента проверки орфографии, например, добавим больше языков. Следите за обновлениями!

    Экономьте время.Сохраните свой бренд. Спаси свою задницу.

    Готовы проверить орфографию? Узнайте, как это может избавить вас от дополнительных шагов проверки и помочь вам отправлять более точные и безупречные электронные письма. Подпишитесь на бесплатную пробную версию сегодня и примите участие в тест-драйве. Или войдите в существующую учетную запись и попробуйте.

    Примечание. Если у вас нет текущего пакета подписки Email on Acid, вам потребуется перейти на текущий пакет, чтобы получить доступ к Campaign Precheck и новой функции проверки орфографии.

    Автор: Email on Acid

    Блог Email on Acid создан для того, чтобы делиться передовым опытом работы с электронной почтой, отраслевыми новостями и решениями наиболее раздражающих ошибок почтового клиента.Кроме того, мы любим немного повеселиться в пути. Узнайте, как присоединиться к вечеринке и внести свой вклад в наш блог.

    Автор: Email on Acid

    Блог Email on Acid создан для того, чтобы делиться передовым опытом работы с электронной почтой, отраслевыми новостями и решениями наиболее раздражающих ошибок почтового клиента.Кроме того, мы любим немного повеселиться в пути. Узнайте, как присоединиться к вечеринке и внести свой вклад в наш блог.

    Исправление орфографии при поиске для Magento 2

    Лучшее решение для увеличения количества заказов в вашем магазине!

    Коррекция орфографии при поиске будет нацелена на ваши условия поиска с ошибками!

    Покупатели вашего магазина могут выполнять поисковые запросы, содержащие опечатки или орфографические ошибки.Вероятно, они не уверены, как именно пишется продукт, который они ищут. Кроме того, ваши покупатели могут очень спешить и пропустить символ, пытаясь на ходу печатать на своем смартфоне или планшете.

    Search Spell Correction — идеальное решение для таких ситуаций! Наше расширение за доли секунды обнаруживает орфографические ошибки или опечатки, исправляет их и предоставляет вашим клиентам наиболее релевантные результаты поиска!

    Кроме того, наше решение предоставляет вашим клиентам возможность резервного поиска.

    Используйте исправление орфографии при поиске, чтобы повысить удобство поиска для посетителей вашего магазина, и с удивлением наблюдайте, как они совершают больше покупок!

    10 преимуществ, которые вы получаете с исправлением орфографии при поиске

    • Исправляет все опечатки.
    • Обнаруживает и исправляет большинство типов орфографических ошибок.
    • Предоставляет вашим клиентам наиболее релевантные результаты поиска.
    • Предоставляет вашим клиентам функцию резервного поиска.
    • Четко уведомляет ваших клиентов об исправленных опечатках и альтернативных результатах поиска.
    • Расширение не требует установки дополнительного программного обеспечения.
    • Поддерживает любой язык!
    • Каждый раз, когда он возвращает результаты поиска за пределами собственного поиска Magento.
    • Анализирует содержимое вашего магазина и запоминает все компоненты.
    • Повысьте качество покупок ваших клиентов!

    Особенности

    Идеальные результаты поиска для опечаток или орфографических ошибок

    Исправление орфографии при поиске предоставляет вашим клиентам высокорелевантные результаты поиска независимо от их запросов.

    Представьте, что покупатели вашего интернет-магазина вводят запрос с опечаткой, например, «Craise Dual Analog Watch». Наше расширение определяет опечатку за доли секунды и предоставляет покупателю:

    • уведомление об опечатке или орфографической ошибке
    • предложенный альтернативный поисковый запрос
    • результатов поиска по альтернативному запросу.

    Таким образом, альтернативным поисковым запросом из нашего примера выше будет «Cruise Dual Analog Watch», и клиент сможет изучить результаты исправленной фразы.

    Наиболее логичным результатом действий нашего решения будет следующее: покупатель вашего магазина это оценит и, скорее всего, совершит покупку!

    Поддержка резервного поиска

    Исправление орфографии при поиске предоставляет вашим клиентам возможность резервного поиска. Резервный поиск означает, что пустых результатов никогда не бывает!

    Наше расширение возвращает результаты для всех запросов, включая случаи, когда собственная поисковая система Magento предлагает нулевые результаты!

    Например, ваш покупатель ищет «спортивные штаны лосося», но в вашем магазине нет такого товара.Расширение в обмен показывает результаты поиска покупателя с альтернативным поисковым запросом «спортивные штаны» без первого слова «лосось».

    Скорее всего, вашему покупателю будет приятно ознакомиться с предложенными результатами и выбрать один из предложенных предметов!

    Search Spell Correction демонстрирует понимание потребностей ваших покупателей, как никогда раньше!

    Простейший внутренний интерфейс

    Search Spell Correction имеет самый простой внутренний интерфейс!

    Вы можете настроить расширение в два простых шага.Это займет у вас всего пару секунд, чтобы достичь!

    Вы можете включить исправление орфографии или резервный поиск — вот и все!

    Наслаждайтесь улучшенными результатами поиска в вашем магазине!

    Установите исправление орфографии при поиске и предоставьте покупателям вашего магазина непревзойденный опыт покупок!

    Как использовать встроенную в Mac программу проверки грамматики и орфографии

    Убедитесь, что все, что вы пишете, идеально, научитесь использовать встроенную проверку грамматики и орфографии на вашем Mac.

    Теперь, когда люди проводят большую часть своего времени в Интернете, общаясь с помощью мгновенных сообщений и электронной почты, многие используют инструменты проверки грамматики и орфографии для полировки своего письма перед отправкой каких-либо сообщений получателям.

    Многие устройства, включая ваш Mac, имеют встроенные средства проверки орфографии и грамматики, которые еще больше упрощают эту задачу. Вот как вы можете использовать эту бесплатную функцию на своем Mac.

    Как проверить орфографию и грамматику на вашем Mac

    В macOS есть встроенная функция, которая проверяет орфографию и грамматику по мере ввода.Это работает в большинстве приложений на вашем Mac. В приложении для Mac вы можете выполнить следующие действия для проверки орфографии и грамматики:

    • Чтобы проверить орфографию: Нажмите Изменить > Правописание и грамматика > Проверить документ сейчас в строке меню. Ошибки будут выделены красным цветом. Обратите внимание, что это выделит только первую обнаруженную ошибку. Нажмите Cmd + точка с запятой (;) , чтобы просмотреть следующую ошибку. Либо щелкните Показать правописание и грамматику , чтобы открыть окно и просмотреть предложения по правописанию, поскольку оно показывает вам орфографические ошибки.
    • Чтобы проигнорировать орфографическую ошибку: Удерживая клавишу Control, нажмите на ошибку, подчеркнутую красным, затем выберите Игнорировать орфографию . Средство проверки проигнорирует слово, если оно снова встречается в этом документе, но не встречается в других.
    • Чтобы проверить грамматику и орфографию: Нажмите Редактировать > Орфография и грамматика > Проверка грамматики с правописанием .Ваши грамматические ошибки будут подчеркнуты зеленым цветом. Наведите указатель мыши на подчеркнутое слово, чтобы увидеть описание ошибки. Проверка грамматики доступна только на английском и испанском языках.

    Если слово, которое вы используете, продолжает определяться как ошибка, когда это не так, например, при использовании технических терминов и жаргона, вы можете добавить его в свой словарь. Введите слово и щелкните его, удерживая клавишу Control, затем выберите Learn Правописание . При этом слово больше не будет помечаться ни в одном документе.Вы также можете отменить это. Просто щелкните слово, удерживая клавишу Control, и выберите Unlearn Spelling .

    Если вы не уверены в правильности написания слова, вы всегда можете спросить Siri. Просто скажите: «Как пишется [слово]?»

    Если вам нужны дополнительные варианты правописания, нажмите F5 (или Fn + F5 ) во время ввода, чтобы просмотреть список предлагаемых слов.

    Включить автокоррекцию на Mac

    Помимо грамматики и орфографии, вы также можете включить автокоррекцию, чтобы автоматически исправлять орфографические ошибки.Чтобы включить эту функцию на вашем Mac:

    1. Перейдите к Системные настройки , затем выберите Клавиатура .
    2. Перейдите на вкладку Текст , затем включите Автоматическое исправление орфографии .

    Автокоррекция теперь будет работать в поддерживаемых приложениях. По мере ввода ошибки будут автоматически исправляться, если есть только одно предложение.Если их больше, вам придется выбирать из предложенных предложений.

    Связано: Как включить или отключить автозамену в Safari на Mac

    Исправленные слова будут кратко подчеркнуты синим цветом. Если вы хотите вернуться к исходному тексту, просто поместите курсор или точку вставки на слово и подождите, пока появится исходное слово, которое вы набрали. Затем щелкните исходное слово.

    Вы также можете отключить автокоррекцию для определенных приложений.Просто откройте приложение, выберите Редактировать > Орфография и грамматика , затем снимите флажок Исправить Орфография автоматически . Если эта опция не отображается, проверьте настройки приложения, возможно, у него есть собственная проверка орфографии.

    Выберите языки для проверки орфографии на вашем Mac

    По умолчанию ваш Mac будет проверять орфографию вашего текста независимо от того, какой язык вы используете. Это может привести к исправлению неанглийских слов, даже если они правильно написаны на другом языке.Вы можете изменить или добавить больше языков, если хотите это исправить. Для этого:

    1. Перейдите к Системные настройки > Клавиатура .
    2. В разделе Правописание выберите язык, который вы хотите проверить. Если вы хотите, чтобы он проверял орфографию для нескольких языков, нажмите Настроить внизу, выберите языки, для которых вы хотите, чтобы проверка орфографии выполнялась автоматически, затем нажмите Готово .

    Мгновенная полировка текста

    Может быть досадно пропустить слово с ошибкой или грамматически неверное утверждение сразу после того, как вы нажмете кнопку отправки. Избавьте себя от унижения, включив встроенную проверку орфографии на вашем Mac.

    Как использовать словарь вашего Mac для быстрого поиска слов

    Читать Далее

    Об авторе

    Рэйчел Мелегрито (опубликовано 158 статей)

    Рэйчел Мелегрито оставила свою карьеру преподавателя в университете, чтобы стать полноценным автором контента.Она любит все Apple — от iPhone до Apple Watch и MacBook. Она также является лицензированным эрготерапевтом и начинающим SEO-стратегом.

    Более От Рэйчел Мелегрито
    Подпишитесь на нашу рассылку

    Подпишитесь на нашу рассылку технических советов, обзоров, бесплатных электронных книг и эксклюзивных предложений!

    Нажмите здесь, чтобы подписаться

    .

    Добавить комментарий

    Ваш адрес email не будет опубликован.