Словарики к урокам — нужна ваша помощь.

Я много раз писал в разных постах на фруме, что мы сейчас работаем над интерактивными словариками ко всем урокам — своего рода говорящими карточками и вообще в широком смысле инструментом для запоминания слов и самопроверки.

Эта работа разбивается на три части — ровно так, как устроены все современные приложения:

  • данные;
  • бизнес-логика (алгоритм работы приложения, скрытый на сервере — back end);
  • представление (визуализация, то, что видит пользователь — front end).

Над вторым и третьим пунктом работают Антон и Алексей, программист из Новосибирска, который помогает нам с фронтендом. Я готовлю сами данные. И мне нужна в этом ваша помощь.

За основу мы берем сводный словарь к урокам — он с пробелами есть для первой пары сотен уроков. Но в лоб этот словарииик для наших задач не годится, потому что в нем не хватает некоторой информации и его форма не вполне удобна. Словарь приходится пополнять такими данными.

  • отмечать номер урока
  • указывать часть речи
  • прилагательные, звучащие по-разному в женском и мужском роде, записывать отдельными строчками

Если на примере, я из такого набора информации:

79cb1283d1beb7146751bf79cfec1231.png

далвю такой:

8e744710f6ba1cefff51dd766a0cc7af.png

У многих слов пометки с частями речи уже стоят (все существительные, многие глаголы, прилагательные и наречия). Разбивка по урокам тоже сделана (границы уроков отмечены — нужно только указать номер урока). В среднем на сейчас это выглядит так:

647781a4a04d268afef2319cfb3f3b57.png


Это первый этап работы. На втором этапе надо составлять словарики к тем урокам, у которых их нет. Но это отдельная большая работа — давайте сперва запустимся с тем, что есть.

Кто готов вписаться в эту работу? Я дам доступ к файлику — это табличка на Google Sheets.

Доброго времени суток. Какое количество уроков необходимо обработать? Сколько, en moynen, у Вас ушло времени на обработку словарика для одного урока?

kuzia53: Какое количество уроков необходимо обработать?

Так вопорс не стоит. Вы вписываетесь и делаете один урок. Это будет Ваш вклад. Кто-то другой вписывается и делает сто — это вклад его.

Всего в словарике ≈3,700 слов. Это 200 уроков (с пропусками). У 2,250 слов я части речи проставил. Сколько прилагательных надо разбивать из одной строчки на две, я не знаю.

kuzia53: Сколько, en moynen, у Вас ушло времени на обработку словарика для одного урока?

Я не подссчитывал. Где много прилагательных, там застреваешь. А где-то просто по Ctrl-D работаешь. Так что всё зависит.

Готова помочь.

Добрый день!
Если нет каких-то очень сжатых сроков (просто в будние дне у меня времени маловато), то я, конечно же, готов помочь! Как ни как это ещё и практика неплохая)

Илья, доброго дня! Я вписывал слова в открытый мне “Colored dictionary 1-184 — самый полный словарь ко всем урокам” -
это другая тема? Там другой формат данных, это уже неактуально? Там закончил 199-м уроком. Готов подключиться к этому формату, какой более необходим?

alexey.volobuev: Я вписывал слова в открытый мне “Colored dictionary 1-184

Скажем так: это продолжение и развитие этой темы. Я взял все, что было в colored dictionary и перенес сюда. Здесь в этой таблице просто больше данных + мы дублируем прилагательные, которые различаются на слух в женском и мужском роде.

samisadorable: Если нет каких-то очень сжатых сроков […], то я, конечно же, готов помочь!

Ева: Готова помочь.

Спасибо, ребята! Я всем вам дал доступ к файлику — смотите в гуглопочту: там внутри уведомления — ссылка на методичку. Осталось 1000 с небольшим неразмеченных слов и фраз плюс прилагательные — это небыстрая тема.

Срочности в этой работе большой нет. Отладку мы будем вести на небольшом кусочке данных. А вся таблица будет нужна к релизу — это, надеюмсь, будет сентябрь. Хотя до этого мы все сроки продалбывали ;)

Еще раз спасибо за помощь!

alexey.volobuev: Готов подключиться к этому формату, какой более необходим?

Заполнение новыми словами — это отдельная большая работа. И я вижу, Вы много вбили в этот словарик! Chapeau bas ! Собственно, он и планировался, как исходные данные для будущего интерактивного словаря к урокам на сайте. Просто сейчас мы определились с форматом данных — поэтому я скопировал основную таблицу из Colored dictionary в новый файл, откуда всё это будет затем втянуто в базу на сервере. Поэтому целесообразно новые слова вбивать уже сюда — сразу с пометкой части речи, рода и разбиения прилагательных и иногда существительных (типа un cheval — des chevaux, un œuf — des œufs) на две, а то и три строчки, если они в разных формах звучат по-разному.

Спасибо, ребята! Я всем вам дал доступ к файлику — смотите в гуглопочту: там внутри уведомления — ссылка на методичку. Осталось 1000 с небольшим неразмеченных слов и фраз плюс прилагательные — это небыстрая тема.

Собсно я уже приступил. Сначала учил матчасть (инструкцию) минут 20 :))
Ответственность оромная, поэтому в словарях проверял все слова, ибо не тот уровень у меня.
В итоге осилил за час слов 12 наверное =\ На выходных постараюсь больше сделать.

У меня только один вопрос, он тупой, но всё же - Как сохранять изменения?) Я боюсь закрывать таблицу, а кнопочку сохранить в упор не вижу. ((

samisadorable: Ответственность оромная, поэтому в словарях проверял все слова, ибо не тот уровень у меня.
В итоге осилил за час слов 12 наверное =\

Не надо так бояться. Кто не ошибается, тот не выигрывает. 5 минут на слово — c’est trop. Там в основном механическая работа. Арно проверил словарь (французскую часть) до 134-го урока. Там практически нет ошибок. А остальное — рутинные операции.
Логируются все шаги, всегда можно откатиться, если что. Но да, запоминаемость слов пропорциональна времени, с ними проведенного. :)

samisadorable: Как сохранять изменения?)

Изменения сохраняются почти мгновенно на ходу сами (в десктопной версии).

Я готов помочь, только вот мой французский pas bien. А так с удовольствием помогу, только скажите

Два вопроса:
1. Поскольку работа получается совместная, как определить, сколько уже обработано и с какого места нужно продолжать?
2. Некоторые слова выделены цветом. Это имеет какое-то значение?

Eugene: Я готов помочь

Спасибо за готовность поучаствовать! Пришлите мне, пожалуйста, в личку или на почту/VK Ваш адрес e-mail, ассоциированный с Google Account, чтобы я мог открыть доступ на редактирование файла.

Ева: как определить, сколько уже обработано и с какого места нужно продолжать?

Продолжать можно с любого места. Сделано частично сплошняком, а частично — вразнобой. То есть, например, Миса идет и покрывает урок за уроком. А я до этого сделал обрывочно по чуть-чуть. То, что надо делать, видно довольно легко:

f759cf674a7530258f7abe84c23d473a.png

Нет номера урока, не проставлены части речи. Плюс прилагательные.

Чтобы оценить масштабы бедствия (трудоемкость и свои возможности) — вот «методичка» по правке слов. На момент написания этого поста из ~200 уроков покрыто уже 75; остальные — в крапинку (см. скриншот выше:).

Ева: Некоторые слова выделены цветом. Это имеет какое-то значение?

Данные взяты из Colored Dictionary — словарика уроков с раскрашенными существительными (слова мужского рода синим цветом, а женского — красным). Для базы данных, куда будут импортироваться эти данные, это не имеет значения. Потому что род проставлен в последней колонке GEN — мы будем в соответствии с этим оформлять карточки в интерактивном словаре, когда всё будет готово. :)

подскажите как понять какое слово к какому уроку. Врядли нужно ставить цифры “от фонаря”. а доступ к урокам ограничен. подскажите что делать

Спасибо, теперь понятно. Только я после 76 урока не вижу границ урока. Как проставлять номер?

Вы говорите, что до 134 урока род сущ. проставлен Арно. Разве 1521 слово “fond” не должно писаться (nom), (m)?
и очень сложно понять где нужно менять, а где нет. Можете объяснить конкретнее?

Ева: Как проставлять номер?

Сверяясь с конспектами. Увы, это одна из проблем.

Eugene: Разве 1521 слово “fond” не должно писаться (nom), (m)?

Хороший пример! В том числе и того, что errare humanum est :) Так что Арно тоже мог проглядеть. И да,

db14d373efe0731f0e7597f488f9bb34.png

…должно быть записано le fond (как неисчисляемое).

Как я писал в мтодичке, если есть сомнения, просто ставьте комментарий — я потом гляну, и мы вместе разберемся. Главное найти проблемное место — это самое сложное. В таком-то массиве данных!

Eugene: Разве 1521 слово “fond” не должно писаться (nom), (m)?

Хороший пример! В том числе и того, что errare humanum est :) Так что Арно тоже мог проглядеть. И да,

db14d373efe0731f0e7597f488f9bb34.png

…должно быть записано le fond (как неисчисляемое).

Как я писал в мтодичке, если есть сомнения, просто ставьте комментарий — я потом гляну, и мы вместе разберемся. Главное найти проблемное место — это самое сложное. В таком-то массиве данных!

гуртом і батька легше бити

 
Зарегистрируйтесь или войдите чтобы оставить сообщение.