LitFrequencyMeterRoots - программа определения частоты повторения корней слов в текстах

LitFrequencyMeterRoots (LFMRoots) - программа определения частоты повторения корней слов в текстах, литературных произведениях, статьях, документах и в Web страницах.

Аннотация 1:

Программа LitFrequencyMeter, предшественница LFMRoots, стала одной из самых популярных программ, опубликованных мной на сайте. Среди поступающих просьб на доработку программы, наиболее частыми всегда были просьбы включить в данную программу подсчет повторов корней слов, и разработать программу разбора текста по составу слов.
   Эти две задачи требовали огромного словаря словоформ и их корней. По грубой прикидке, словарь должен содержать более 100 000 словоформ. Такой, общий для двух программ словарь, одному не сделать. В силу этого, работа долго не могла начаться. Но однажды Людмила Голубовская предложила помощь своих подруг, которые на ты с компьютером. Работа продлилась практически год и, в настоящее время, в первом приближении, создана программа подсчета повторов корней слов в текстах. Программа создана при активном участии Галины Топорихиной.
Автор выражает благодарность Алевтине Сафьяновой за помощь в ответе на возникающие вопросы в ходе работы и за её замечательный блог, которым автор пользовался постоянно.
   Сегодня, я представляю на сайте первую программу. Работа над ней продолжается в плане улучшения качества. Программа с каждой новой версией будет всё боле точно соответствовать своему предназначению. И я надеюсь на помощь всех. Присылайте словоформы, которых нет в словаре и, если найдёте ошибки, то просьба сообщать.

Кроме того, Вы можете сами улучшать словарь, так как в программе предусмотрена возможность просмотра и редактирования словаря в текстовой форме.

Аннотация 2:

На этой странице представлено несколько скринов второй программы - программы разбора текстов по составу слов. Я обращаюсь ко всем, кто хочет помочь быстрее создать эту программу и навсегда войти в её историю, а также получить первый подарочный экземпляр с последующим получением всех обновлений обоих программ -
НАПИШИТЕ АВТОРУ - Молчанову Владиславу - по адресу ( wladm@narod.ru ) , предложите помощь    и я Вам вышлю инструкцию, что и как надо сделать, и букву, для которой надо будет закончить оцифровку
.

На мой взгляд, программа будет полезна:

  • Учителям и ученикам школ.

  • Педагогам и студентам вузов, научным сотрудникам.

  • Каждому, чтобы узнать больше о своем родном языке.

  • и т.д., и т.п.

И так о программе:

  1. Описание программы LFMRoots - первая программа комплекса

  2. Заставка программы

  3. Закладка "Формирование статистики"

  4. Закладка "Просмотр статистики в графической форме"

  5. Закладка "Работа со словарями"

  6. Закладка "Исключить из статистики"

  7. Скачать демоверсию

  8. Презентация программы Roots - вторая программа комплекса

В начало

1. Описание программы - первая программа комплекса

Внимание! Программа запоминает свои размеры и установки на момент закрытия - при старте их восстанавливает.

Программа предназначена для определения частоты повторения корней слов в текстах, литературных произведениях, статьях, документах и Web страницах. Программа работает с текстовыми, HTML и Word файлами. Любой текст, также может быть просто скопирован через буфер обмена Windows. Ограничений на длину текста нет.

Программа позволяет:

  • определить число корней и частоту их повторения в загруженном документе (тексте, фрагменте текста);

  • создать статистику, расположив корни слов по частоте повторения или алфавиту;

  • определить процент повторений каждого корня и всех корней по нарастанию;

  • просмотреть все слова, в котором встретился найденный корень;

  • просмотреть слова, для которых программа не нашла корни.

Для наглядности программа имеет возможность отображать данные для максимального числа повторяемых слов не только в табличном, но и в графическом виде. Графическое отображение может быть настроено как к отношению единичных корней ко всему числу слов (знаков) в тексте, так и к группе наиболее часто повторяющихся корней.

Программа имеет множество настроек, позволяющих приспособить настройки "под себя".

В начало

2. Заставка программы

Программа при старте отображает заставку программы, которая находится в файле ("zast.jpg") в директории, где и ".exe" файл (Рис.1). Вы легко можете поменять заставку, заменив этот файл или воспользоваться меню View, группа пунктов "Действия по смене заставки" (выполняются последовательно). Кроме того, Вы можете вообще отказаться от показа заставки, поставив галочку в меню "View" - пункт "Не отображать/отображать заставку". Тогда при следующем запуске стартовой будет закладка "Формирование статистики".

lfm01.jpg

Рис.1. Заставка программы

В начало

2. Закладка "Формирование статистики"

На данной закладке (Рис.2.) имеется возможность выбора что анализировать: данные из файла или из буфера обмена (если туда Вы предварительно поместили текст).

lfm02.jpg

Рис.2. Закладка "Формирование статистики"

Соответственно, при выборе формирования из файла Вы имеете возможность провести анализ не ограниченного по длине текста (.doc, .docx, html, .txt).

Для анализа нажмите кнопку "Загрузить файл с диска", в стандартном диалоге выберите тип файла и имя файла и нажмите "Открыть". Файл будет сохранен в массиве данных и будет показан в окне просмотра. Также файл может быть выбран для просмотра нажатием левой кнопочки кнопочного бара программы и при необходимости скорректирован (корректировка в окне просмотра при работе с файлом не влияет на результат, так как, в этом случае, файл уже загружен и находится в программе). Не забудьте вновь загрузить файл, если вы его подвергали корректировки, предварительно нажав кнопочку "Очистить". После выбора файла Вам становится доступной кнопка "Формирование отчета из загруженного файла".

Если данные для анализа загружаются из буфера обмена, то становится доступной кнопка "Формирование отчета из окна просмотра". После нажатия одной из ставших доступных кнопок, статистика отобразится в окне просмотра.

С этого момента становится работоспособным ChechBox "По алфавиту\По убыванию значений". Снятие и установка галочки будет показывать статистику, соответственно, по алфавиту и по убыванию.

Пример анализа произведения А.С. Пушкина "Евгений Онегин" приведен на Рис.3.1, 3.2, 3.3 и 3.4:

lfm031.jpg

Рис.3.1, Пример отображения результатов статистики в табличном виде по повторяемости

lfm032.jpg

Рис.3.2. Пример отображения результатов статистики в табличном виде по алфавиту

lfm033.jpg

Рис.3.3. Отображение слов, для которых найден корень (кликнуть мышкой по строке с найденным корнем).

lfm034.jpg

Рис.3.4. Отображение слов, для которых корни не найдены (нажать мышкой по кнопочке с вопросительным знаком).

На Рис.3.4 мы видим всего несколько слов для которых не найдены корени. Их всегда можно добавить, пользуясь закладкой работа со словарём.

В начало

4. Закладка " Просмотр статистики в графической форме"

Позволяет просмотреть результаты анализа в графической форме: в виде линейной диаграммы (Рис.4.), гистограммы (Рис.5.) и круговой диаграммы (Рис.6.). Каждая диаграмма имеет свой пункт меню настройки (соответствующие кнопочки в кнопочном баре). Меню общей настройки позволяет задать число отсчетов для формирования графического отображения и то, как отображать эти отсчеты. А именно: выбранное число отсчетов соотнести ко всем знакам (словам) или только к выбранным (пункт "Статистика N-1 отсчетов к остальным значениям \ Статистика выбранных N отсчетов"). Если поставить галочку в меню "Настройка\Работа", то можно настроить графическое отображение до его использования для анализа текстов.

lfm04.jpg

Рис.4. Линейная диаграмма результатов

lfm05.jpg

Рис.5. Гистограмма анализа результатов

lfm06.jpg

Рис.6. Круговая диаграмма результатов

В начало

5. Закладка "Работа со словарями"

Пример работы со словарями показан на Рис.7. Словари можно создавать из текстовых файлов. Одна строка в файле – одно слово или словоформа. Можно создать пустой словарь и добавлять в него слова или группы слов непосредственно с панели управления или из файла. Сложности работа со словарем не должна представлять, так как каждому действию со словарем соответствует одна кнопка.

Все словари по умолчанию сохраняются в директории программы, в поддиректории \Dictions. При старте программы проверяет эту папку и все имена файлов созданных словарей загружает в выпадающий список “Рабочий словарь”. Это позволяет быстро выбирать требуемый словарь.

lfm07.jpg

В начало

Рис.7 Работа со словарями

В начало

6. Закладка "Исключить из статистики"

На данной закладке из статистики можно исключить до 50ти предлогов, слов... Стартовые значения показаны на рисунке 8. Заполнение строго слева направо и сверху вниз. Пароль присылается вместе с рабочей версией программы.

lfm10.jpg

Рис.8 Закладка "Исключить из статистики"

7. Скачать демоверсию

Программа высылается в обновлении 02.12.2014г.

Особенности работы с программой

Программа требует для работы Windows XP SP3 и выше (то есть - у вас должен быть установлен Frameworks 4).
Для тех, у кого старый Windows, потребуется установить дистрибутивный пакет Microsoft .NET Framework 4.0 или выше. Его можно скачать бесплатно с сайта Microsoft (Ссылка 1) или более близких ссылок. В любом поисковике наберите "Microsoft .NET Framework 4 скачать" и Вы найдете еще множество ссылок и инструкций по установке (хотя они и не требуются, пакет устанавливается как обычная программа).

Программа поставляется как zip архив. З2 битная версия работает и на 64х битных Windows, но кто уже давно и на работе и дома использует 64х битные версии, может персонально получить именно 64х битную. Распакуйте "setupLFMR32.zip" или "setupLFMR64.zip" в любое место жесткого диска. Запустите setupLFMR32.exe или setupLFMR64.exe, отвечайте на вопросы и программа будет установлена. Не ставьте лишних галочек при инсталляции, за исключением "Поместить иконку на рабочем столе" - ее поставьте обязательно.

После установки программы вы найдете в меню "Пуск", "Все программы", "wladm" папку с программой и иконку программы на рабочем столе.

lfm08.jpg

Не забывайте, что это первая публикация программы и в ней может быть много неточностей в правильном определении корней. Со временем программа будет совершенствоваться и всё более точно соответствовать своему целевому назначению. А пока, в программе есть возможность при необходимости поправить словоформу самостоятельно, добавить словарь или удалить словоформу с ошибкой.

Здесь можно Скачать демоверсию программы для XP, Windows 7,8 (32бит) ~ 4 390 кб.

Здесь можно Скачать демоверсию программы для Windows 7,8 (64бит) ~ 4 390 кб.

Данная программа - демоверсия! Демоверсия имеет ограничения: выводит только часть статистики. Если Вас заинтересовала программа - пишите автору wladm@narod.ru , разопьем кружечку хорошего пива и Вы сможете работать без ограничений. Если вы готовы принять участие в работе по созданию программы, то можите стать и соавтором - см. Аннотацию в начале страницы.

Молчанов Владислав 1.04.2014г. - 04.12.2014г.

В начало

8. Презентация программы Roots - вторая программа комплекса

Программа разбирает текст по составу слов. Текст загружается из буфера обмена. Сразу происходит разбор слов по составу. При подведении курсора к любому окну разбора (Рис.9) программа показывает корни этого слова. Словарь программы уже имеет более 150 000 словоформ.
Всех приглашаем принять участие в его пополнении - подробности см. Аннотацию в начале страницы.

lfm09.jpg

Рис.9 Программа Roots

Молчанов Владислав 04.12.2014г.

В начало страницы

На главную страницу