Слепая печать:
  Championship-Ru
  Championship-En
Список форумов urikor.net urikor.net
Все о слепой машинописи и клавиатурных тренажерах
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Определение сложности текста.

 
Начать новую тему   Ответить на тему    Список форумов urikor.net -> Typing Statistics - утилита для анализа параметров набора текстов
Предыдущая тема :: Следующая тема  
Автор Сообщение
Марусяк Валерий
Подполковник
Подполковник


Зарегистрирован: 11.08.2008
Сообщения: 1001

СообщениеДобавлено: Пн Янв 26, 2009 10:34 pm    Заголовок сообщения: Определение сложности текста. Ответить с цитатой

На форуме время от времени возникают споры, в которых присутствует термин сложность текста. Может быть, имеет смысл его вычислять? Это могло бы стать еще одной интересной фишкой программы. Формулу придется пообсуждать многократно Smile. Для начала предлагаю такую: количество символов + количество символов цифрового ряда без шифтов + количество символов, для нажатия на которые требуется шифт + количество сложных 2символьных сочетаний (МИ, КИ, ИЕ и т.д.)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Марусяк Валерий
Подполковник
Подполковник


Зарегистрирован: 11.08.2008
Сообщения: 1001

СообщениеДобавлено: Чт Фев 05, 2009 9:52 pm    Заголовок сообщения: Ответить с цитатой

Предлагаю размышления о процессах, происходящих во время печати, перенести в отдельную тему. Например, "Модель процесса печати" или "Как устроена печать" и так далее.

Сегодня прочитал тему "Чемпионат для профессионалов" и обнаружил там несколько интересных постов:
15 февраля 2007 года NM писала:
Цитата:
Дорогие участники профессионального чемпионата!
Я не перестаю надеяться, что возможно выработать критерии сложности текста. Давайте попробуем. Что для вас значит "сложный текст". Это текст какой? Напишите, пожалуйста.
Dron:
Цитата:
Сложный - с обилием цифр, символов и нетипичных для русского языка слов - иностранные фамилии, названия и т.д. Характерный пример - энциклопедические статьи.
NM:
Цитата:
А если нет цифр, символов и нетипичных для русского языка слов - иностранных фамилий, названий и т.д., то текст ПРОСТОЙ? Или нет? Что еще усложняет текст?
Dron:
Цитата:
Заглавные буквы, думаю. Вот недавно был тур, состоящий из предложений по одному слову. Обилие заглавных букв значительно замедляло набор.
Автандилина:
Цитата:
1. Чем менее связный текст, тем сложнее для набора. Даже если сами по себе слова в нём лёгкие.
2. Движения, физически трудные для пальцев. Много букв или знаков подряд на одну руку, маршруты от нижнего ряда к верхнему и т.д.
3. Какая-нибудь детская, разговорная тематика, очень конкретные реплики, а также имена собственные.
Dron:
Цитата:
Тексты с орфографическими и с пунктуационными ошибками - очень сложны для набора. Smile


Хотелось бы все-таки иметь некий алгоритм оценки сложности текста. Конечно, Юрий сейчас уже может сделать это легко "на глаз", но автоматизация никогда не помешает Smile. Причем, алгоритм должен быть весьма простой, чтобы можно было выполнить расчет не только специальной программой, но и подручными средствами в виде Ворда и т.д.

Сложность текста предлагаю выражать в количестве символов в нем и (в скобках) его относительной сложности. Например, сложность текста короткого чемпионата может быть представлена так: 510 (12%).

Относительная сложность - это некоторое число N, поделенное на количество символов в тексте и все это помноженное на 100%.

Число N = количество пробелов в тексте + количество символов [1234567890-] + удвоенное количество символов [ёъ!"№;%Confused*()_+=,] и заглавных букв. То есть, пробелы и символы [1234567890-] имеют вес 1, а символы [ёъ!"№;%Confused*()_+=,] и заглавные буквы - вес 2. Прикольно, двоеточие и амперсанд преобразовались в кривой смайлик Smile.

Количество символов с пробелами и без легко посмотреть в Ворде, а количество остальных можно быстренько прикинуть на "глаз". Например, этот текст имеет сложность 519 (26%).
Цитата:
Яйца, фаршированные лососем. Консервированный лосось 1 банка, яйца 6 шт., репчатый лук 1 шт., тертый сыр 100-150 г, майонез, зелень. Яйца отварить, очистить, разделить пополам, отложить желтки в миску. С лосося слить воду, удалить кожу и кости, измельчить, переложить к яйцам. Лук измельчить и смешать с рыбой и яйцами, протереть все сквозь сито или взбить вилкой. Добавить сюда тертый сыр и майонез, перемешать. Наполнить этой воздушной массой половинки белка, украсить сеточкой из майонеза, зеленью, ягодами брусники.

А этот - 519 (44%).
Цитата:
Чистов Д.Е. Отчетная археологическая сессия за 1999 год. Тез. докл. СПб. 2000. С 23-25. Виноградов Ю.А. Проблемы археологии и истории Боспора. К 165-летию Керченского музея древностей. Тезисы докладов юбилейной конференции 13-19 октября 1991 года. Керчь, 1991. С. 13-14. Гайдукевич В.Ф. Мирмекий. Советские раскопки в 1956 г. т. 2. Варшава. 1959. Молева Н.В. Раскопки некрополя Мирмекия в 1974-1975 гг. КСИА. № 168. М. 1981. С. 73-77. Пругло В.И. Восточные кварталы Мирмекия в свете археологических исследований 1957 г.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Автандилина
AvtandiLine


Зарегистрирован: 06.12.2005
Сообщения: 3208
Откуда: Москва и Санкт-Петербург

СообщениеДобавлено: Чт Фев 05, 2009 10:49 pm    Заголовок сообщения: Ответить с цитатой

Марусяк Валерий писал(а):
Например, этот текст имеет сложность 519 (26%).
Цитата:
Яйца, фаршированные лососем. Консервированный лосось 1 банка, яйца 6 шт., ... украсить сеточкой из майонеза, зеленью, ягодами брусники.


Не_имею представления, как исчислять сложность текста, но этот текст (Короткий чемпионат, тур 1, февраль 2009) - для меня очень сложный, просто чудовищный.
(Совсем не_против таких текстов в чемпионатах, а только в связи с данной темой))).

Второй текст из примера - вроде бы сложный, да, но его конструкция мгновенно формализуется, а лексика однородна. Чуть удлините такой текст - и к концу набор уже значительно облегчится. На именах нужно будет концентрироваться, а остальное, в том числе даты и чередования знаков препинания, станут уже "проскакивать на автомате".
_________________
http://klava.tel быстрая справка, http://www.liveinternet.ru/community/faq_avtandiline/post153540114/ Амишка (AMi) и ФАВТ
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Автандилина
AvtandiLine


Зарегистрирован: 06.12.2005
Сообщения: 3208
Откуда: Москва и Санкт-Петербург

СообщениеДобавлено: Чт Фев 05, 2009 10:56 pm    Заголовок сообщения: Ответить с цитатой

И еще такое общее соображение.

Говоря о сложности - сложности для чего? Для скоростного набора? Для удобного, не_вызывающего напряжения набора?

Вот второй текст из примера: imho, если он будет длинный и набирать не_спеша, то (профессионалу) его набрать вполне легко. А первый текст, с такими горнолыжными фокусами для пальцев, даже и не_спеша набрать трудно. Smile
_________________
http://klava.tel быстрая справка, http://www.liveinternet.ru/community/faq_avtandiline/post153540114/ Амишка (AMi) и ФАВТ
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Dron
Полковник
Полковник


Зарегистрирован: 06.07.2005
Сообщения: 2213
Откуда: Odessa

СообщениеДобавлено: Чт Фев 05, 2009 11:02 pm    Заголовок сообщения: Ответить с цитатой

Марусяк Валерий писал(а):
Предлагаю размышления о процессах, происходящих во время печати, перенести в отдельную тему. Например, "Модель процесса печати" или "Как устроена печать" и так далее.
Это правильно. Вынес сюда.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Dron
Полковник
Полковник


Зарегистрирован: 06.07.2005
Сообщения: 2213
Откуда: Odessa

СообщениеДобавлено: Чт Фев 05, 2009 11:16 pm    Заголовок сообщения: Ответить с цитатой

Да, текст про фаршированные яйца сложный за счёт нетипичных сочетаний. "шт.,", например. После точки пальцы так и рвутся к пробелу, а тут бах и запятая. Надо почти новый навык вырабатывать. а "150 г,". Такое редко приходится набирать и граммы, кстати, должны как "гр." вроде сокращаться, так что это те самые ошибки, которые усложняют текст. Формализации не поддаётся.

Но тот подход, что вы описали вполне имеет право на жизнь. Грубо прикинуть сложность по нему можно. Только я бы цифрам большие веса дал - 1.5 хотя бы. Всё-таки пальцам надо далеко тянуться. Ещё можно автоматизировать определение сложности так. Оценивать, насколько сильно вероятностное распределение букв отличается от типичного для русского языка.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Автандилина
AvtandiLine


Зарегистрирован: 06.12.2005
Сообщения: 3208
Откуда: Москва и Санкт-Петербург

СообщениеДобавлено: Чт Фев 05, 2009 11:56 pm    Заголовок сообщения: Ответить с цитатой

Про методы подсчета сложности текста я и заикаться не_стану. Smile Пусть специалисты разрабатывают.

Но оставлю за собой право обходиться, если что, вообще без числовых методов и формул. Smile Поскольку считаю, как бы сказать, "непоправимо-преобладающим")) субъективный фактор - личную практику и личные природные данные наборщика. То, что одному легко, другому может оказаться трудно, и наоборот тоже!.. (Уже где-то сказала, извиняюсь за повтор).
_________________
http://klava.tel быстрая справка, http://www.liveinternet.ru/community/faq_avtandiline/post153540114/ Амишка (AMi) и ФАВТ
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Марусяк Валерий
Подполковник
Подполковник


Зарегистрирован: 11.08.2008
Сообщения: 1001

СообщениеДобавлено: Сб Фев 07, 2009 10:18 pm    Заголовок сообщения: Ответить с цитатой

Автандилина писала:
Цитата:
Говоря о сложности - сложности для чего?
Если бы я знал! Smile Сначала было просто интересно, а теперь даже и не представляю - зачем мне все это нужно? Хотя, есть несколько мыслишек Smile. Как только они оформятся, сразу напишу.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов urikor.net -> Typing Statistics - утилита для анализа параметров набора текстов Часовой пояс: GMT + 2
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group
Русская поддержка phpBB
Как бесплатно сделать свой сайт    Просто о сложном