❢ Мы запустили флэш-карточки со словами уроков. Yahoooo!!!

Сегодняшний lень в истории сайта le-francais.ru — это большое событие.

Мы наконец-то запустили карточки к нашему словарику

Мы начали этот проект в середине июля, когда к нам присоединился Леша Урсул, фронтенд-программист из Новосибирска. Теперь, когда позади четыре (!!) месяца работы я понимаю, что без его помощи мы никогда бы не справились с этой задачей. Навскидку она выглядит несложной — пока не окунешься в обдумывание мелочей. Те решения, котрые теперь выглядят очевидными, принимались после фиговой тучи ошибочных, но тем не менее, реализованных в ранних версиях: пока не увидишь и сам не попробуешь, не поймешь, что не то.

Леша, спасибо тебе огромное за твое терпение и — главное! — за твое мастерство и профессионализм, за твой бескорыстный вклад в наш проект!

Ну что, друзья, мы добавили к нашему самоучителью еще одну очень важную фишку. Я попробовал учить слова с помощью нашего словарика. И — оно работает. И это я еще не дошел до интервального повторения.

Сейчас меня переполняют чувства. Я побежал за шампанским. Позже я напишу еще поподробнее о нашем новом приложении, о том, чего от него жждать, о known bugs и наших планах на совершенствование того, что есть в сегодняшней версии 1.0. И дам ссылку на ветку, куда репортить баги.

Пользуйтесь! Учите французский и получайте удовольствие. И да: на всех уроках, где вы угощали нас кофе, когда бы это ни было, словарик работает.

UPD: Ах, ну да! ПРиложение лежат на страничках уроков на вкладке «Карточки со словами».

Флэ-карточки

Внешний вид приложения нарисовала для нас Вика Думова, моя дочь. А бэкенд (серверную часть) написал Антон Думов, мой сын (как, впрочем, и почти весь остальной бэкенд на сайте).
И спасибо огромное всем тем, кто помогал нам готовить сами словарики — вычитывал их, добавлял слова, звучащие иначе в женском роде, расставлял части речи и род. И отдельный поклон Надежде, тестировавшей словарик на всем пути его эмбрионального развития. Друзья, вы нам очень помогли!

Ребята, мы сделали это! :)))

Mes félicitations!!!

Je m’appelle Vlad :)

Здравствуйте!
Большое спасибо за сайт! Занимаюсь 3 месяца и получаю огромное удовольствие. Эти карточки тоже очень удобное изобретение. Но у меня возникла проблема в их использовании. Почему то в режиме запоминания они работают хорошо, а режим проверки не работает совсем (или просто я не понимаю, как его включить). Помогите разобраться, пожалуйста.

P.S. Ой, сама поняла уже ))) надо просто угостить вас кофе, а я это начала делать только с 7го урока, там все карточки работают в двух режимах.

Бесценная вещь! Иногда пользуюсь Quizlet, работающим аналогично, для проработки словарных тем, а тут прям по урокам все подобрано и под рукой! И похоже что в автопроизношение роботом кое-где вмешивались чтобы поправить? Огромная работа! Эх, жаль что что я уже прослушал как раз 200 уроков ) Ну, будет стимул возвращаться назад для повторения.

Alexey: И похоже что в автопроизношение роботом кое-где вмешивались чтобы поправить? Огромная работа!

Алексей, спасибо за похвалу и за то, что Вы это заметили и оценили! Там действительно копий было поломано немало. После того, как мы получили окончательный список слов, мы потратили две недели, чтобы привести их в порядок, организовать и озвучить. И на этом пути встретилоась уйма неожиданных проблем.

Во-первых, действительно, слова озвучивались синтезом голоса не так, как хотелось. К счастью, есть Speech Synthesis Markup Language (SSML), язык разметки, который позволяет немного влиять на произносимый текст.

Дело в том, что во французских словах словарика полно фраз, которые обозначают глагольное управлеие или просто в конце фразы идет часто употребляющийся в этом месте предлог. И проблема вот в чем.

Когда мы произносим фразу, обозначающую паттерн, то есть незаконченную фраззу, оборванную на предлоге, мы произносим ее не так, как обычно. Например, фразу «Чтобы пройти к…» мы произнесем с акцентом на [к], то есть не так, как этот же кусок, просто выраванный из текста («Чтобы пройти к Эрмитажу») — pour aller à… или pour aller au/aux....

Еще хуже обстоят дела с предлогом de — французы зажевывают его и произносят его очень кратко: например, фраза mot de passe, которую мы себе представляем, как [мо дё пасс], французы произнесут совершенно не так. Они ее произнесут, как [модпас]. И вот это [д] в середине и есть звук, который у них соответствует предлогу de. В результате все фразы словарика, которые заканчиваются на этот предлог, звучат и непонятно, и неестественно. Например, parle de…, если его в лоб отдать синтезатору, прозвучало бы, как [парлед].

И вот для того, чтобы сделать акцент на предлоге, пришлось в каждую такую фразу вставлять тэги, которые делали бы акцент. На примере фрагмент таблицы. Слева исходная фраза, а справа — фраза, подготовленная для синтезатора.

920478afca8f64f56f3ab45a809df044.png

b42ce300254d7599ec85ce57402b6000.png

В ход шло всё — только бы добиться нужного звучания. Запятые и знаки вопроса — мы экспериментировали с тремя системами Text To Speech (Microsoft, Amazon и Google), потому что они по-разному отрабатывали управляющие тэги. И в результате разные типы фраз произносят разные синтезаторы, потому что у каждой что-то получалось лучше, а что-то — хуже…

То есть да, мы не просто нажали кнопочки и сказали: «Горшочек, вари», — нет, мы попотели над этой проблемой. А поскольку списки огромные (на сегодня четыре тысячи слов), пришлось разобраться во всех трех системах, чтбы управлять ими программно (у каждой свой API) и, синтезируя звук, одновременно помещать файлы на сервер, а ссылки на них — в базу. Да, это была непростая задача, которая заняла у нас две недели.

Отдельной проблемой стали для нас дубликаты. Поскольку метод интервальынх повторений никто не отменял, он на занятиях использвался явным образом: когда слово забывалось, оно всплывало на уроках снова и снова. Заносилось в тетрадку и попадало в словарь.

Что с такими словами делать? Поскольку каждое слово в словаре запускает цепочку интервальных повторений, мы не можем на кадую встречу такого дублирующегося слова запускать новую цепочку. Таких слов 15% в полном списке слов, а с учетом их повторений это — ⅓ всего словаря. Как быть?

Мы решили их оставить, но сформировать унифицированный перевод для повторяющихся слов. ПРишлось найти все дубликаты и перевести их одинаковым образом. Но и оригинальный (из конспекта взятый) перевод мы сохранили.

2eaab24f7370bf8a06596ef02f95b7f2.png

Унифицировать пришлось и французское слово. Следующий скриншот дает понять, насколько различались и слова, и переводы для, фактически, одного и того же слова — их все пришлось унифицировать.

Отдельной задачей были случаи, когда одно и то же слово всплывало на уроке в другом значении. Например, essayer — это пробовать, пытаться, а когда мы дожодим до темы магазина одежды, это — примерять одежду. И слово появляется в словарике в новом значении, а значит его нельзя «склеивать» с предыдущими дубликатами.

eda9aa86d29f0aa3efd34de6dffcb05d.png

Все такие партные слова, а также их многочисленные значения хранятся в базе тоже. И в поведении приложения мы приняли такой алгоритм поведения: если слово встречается в первый раз, он формирует цепочку повторений. Когда оно встречается повторно, оно есть в списке, который мы прослушиваем (его оттуда можно, при желании, удалить), но оно не идет в проверку и создает новую цепочку — потому что в этом значении это слово уже запущено в интервальные повторения. Но вот если это слово встречается в новом значении, оно идет, как абсолютно новое со всеми вытекающими.

Сегодня мы приступили к работе над инструментом, позволяющими как-то управлть своими словами. Есть такой работающий прототип, пре-альфа. Это фильтр по номеру урока, степени запомненности слова, числу его повторений etc. — по такому фильтру можно получить список слов, чекать и анчекать их и по результату (пока) запустить на повторение (например, самые трудные слова с низшим персональным рейтингом запоминаемости).

Скриншот под спойлером — дюже большой:

a746f9d1c519383acfc3e22e35b5e789.png

Результат — список слов, удовлетворяющих фильтру:

8c35b523c973401a8157a7f018ca05e7.png

И длаьше этот список можно пустить на авторотацию с произношением (анпример) или сохранить, как именованную выборку (это я мечтаю так:). В общем, мы планируем в будущем дать возможность маниппулировтаь такими списками и изменять атрибуты каждого слова в нем — оставить/вычеркнуть, подвинуть в расписании повторений, поменять степень запоминаемости.

Весь такой функционал будет особенно удобен тем, кто, как Вы, Алексей, или как я, прошел уже много уроков и хочет из большого списка выбрать слова, которые забылись, и дрилить только их, а не повторять bonjour, toujour и merci. ;)

Вот так обстоят на сегодня дела. И да, на подходе запоминака глаголов. Тоже задачка… :)

Здравствуйте!
А я не поняла, как найти эти самые флеш-карты.
На страничках уроков их нет.
Я просто тупо зашла в Интернете на ваш сайт и занимаюсь.
Может, на какой-то другой платформе все это?
Просветите пожалуйста.

Танюша: А я не поняла, как найти эти самые флеш-карты.

Добрый день! Собственно, вот:

ILYA DUMOV: Ах, ну да! ПРиложение лежат на страничках уроков на вкладке «Карточки со словами».

И это же — в картинках.

81cb6733fd0e94d38a651ae081d30cee.png

ILYA DUMOV: UPD: Ах, ну да! ПРиложение лежат на страничках уроков на вкладке «Карточки со словами».

Антон только не исправил баг, при котором после открывания табика он переименовывается.

НО! Есть дырки в уроках — то есть несколько уроков (в пятидесятых) где карточек нет (пока). Как только сделаем к ним слова (или как только кто-нибудь это сделает, чтобы ускорить этот процесс), мы поместим их и туда.

А другой платформы у нас (увы!) нет.

Нашли?

UPD: Баг с переименованием табика исправили.

Приложение «Мои слова» потихоньку эволюционирует. Я думаю, до конца недели доделаем. Потому что мы уже дошли до иконок, а это признак близкого завершения.

Вариант со звездочками (не айс):

3e31f48d53cd6021d094613df7ccf674.png

Вариант с палочками:

d1d960d519cf85431c81142e8c315f13.png

Будут добавлены еще фильтры по сложности и числу пройденных повторений — и дело в шляпе. :)

Пардон!
В моем случае такой вкладки вообще нет почему-то.
И меня терзают смутные сомнения, что это теперь платно, так же, как и материал для повторения и домашка.
C”est vrai?

Танюша: В моем случае такой вкладки вообще нет почему-то.

Это ОЧЕНЬ странно! Не могли бы Вы прислать скриншот мне в личку? Потому что не должно быть такого, чтобы не было вкладки.

Танюша: меня терзают смутные сомнения, что это теперь платно

Ну, вообще-то весь проект держиться на пожертвованиях. Он иначе просто существовать не может. И объем пожертвований, которые мы ждем, столь смешон, что, ме кажетмся, это не может быть преградой ни для кого. Что такое, скажем, 39 рублей за роскошные уроки с кучей дополнительных материалов, которые дают реальный рост в языке (при цене уроков на курсах на порядок выше с результатом на порядок меньшим), если даже проехать одну остановку на трамвае стоит больше? И при том, что мы еле выживаем уже который год, работая над этим проектом. У Вас это звучит так, будто это просто чудовищно неподъемные расходы. просто какой-то show stopper, котрый себе могут позволить только nouveau riches. Да сейчас в магазин скромно сходить один раз — это минимум штук пятьдесят таких уроков! Вы (не Вы персонально, а вообще — кто здесь учится) тратите ЧАСЫ на занятия здесь — записи уроков, транскрипты, конспекты, упражнения, карточки — черта в стуле только нет. И это правда не стоит того, чтобы поддержать двух чуваков, которые все это педалят уже который год, постоянно докладывая в проект?!

Ох!

Добрый день, Илья!
Вы меня неправильно поняли. Это просто был вопрос.
Да я восхищаюсь уроками и подачей материала.
За счет многократного повторения слова оседают в памяти навсегда.
Я слушаю произношение и сама пытаюсь говорить. Это очень и очень здорово.
Я благодарна вам за ваш титанический труд.
И это, конечно же, стоит того, чтобы поддержать двух чуваков!!
Вкладка с карточками есть, оказывается, на других уроках.
Просто я сейчас на 29-м уроке и ее там не оказалось, что и ввело меня в заблуждение.
Пардон.

Танюша: Пардон.

Извините ВЫ меня. Больная тема. Всё время срываюсь. :)

Накопилась некоторая статистика по тому, как люди отвечают на на проверке знаний слов. Наша главная задача — правильно трактовать «зашифрованный» в этих действиях ответ. После самопроверки (режим «Проверяем)» каждому слову оказывается присвоена оценка по шестибальной шкале — от 0 до 5. Алгоритм ожидает оценки ответа

5 - безупречный ответ
4 - правильный ответ после некоторых колебаний
3 - с трудом, но правильно
2 - неправильный ответ, но правильный был где-то рядом.
1 - неправильный ответ; правильный вспомнился после напоминания
0 - первый раз вижу это слово.

Мы рафинировали все слова (удалили все, что в скобках, висящие предлоги, артикли…) и смотрим, сколько букв открывается при подсказке в значимой части члова или фразы и какой был ответ (помню / не помню). Из комбинации разных вариантов мы сделали свою схему оценок:

5 - помню;
4 - подсказка до 40% букв → помню;
3 - подсказка от 40% до 60% букв → помню;
2 - подсказка > 60% букв → помню / не помню — ответ неважен;
1 - не помню, но на второй итерации припоминаю
0 - не помню ни в первом круге, ни на второй итерации

Из этих оценок расчитывается коэффициент сложности. Он влияет на то, каким будет интервал на третьем этапе повторения и дальше. Схема такая:

  • первое повторение всегда на следующий день;
  • второе повторение — через шесть дней после предыдущего;
  • третье, четвертое и пятое — зависят от оценок, полученных на всех этапах и могут сильно разниться (интервал может вырасти на 30%, а может увеличиться втрое).

При ответах с оценкой меньше трех происходит откат до начального состояния с нулевой суммой: все повторения начнутся, как будто слово встретилось впервые, но плохая карма у слова сохраняется и влияет на последующие интервалы.

В итоге, слова, которые плохо вспоминаются, будут встречаться чаще, и может пройти не пять повторений, а больше — до тех пор, пока слово не выучится.

Табличка со словами позволит следить за состоянием своих оценок. Сегодня это уже выглядит примерно так:

12fcd167f2dacab1f48138ccbbd3992a.png

Оценка — это средняя величина, полученная словом на всех повторениях.
Надписи на кнопках и вообще тексты — всё это рабочее пока.

Вопрос, словарная база флэш-карточек повторяет словарную базу на основе которой сделаны файлы к программе BX-Language?

Dimitri: словарная база флэш-карточек повторяет словарную базу на основе которой сделаны файлы к программе BX-Language?

Отчасти. Сперва этот словарь был здорово переработан группой добровольцев. Затем я провел над ним несколько ночей для выявления дублирующих слов и объединения их в группы — этот массив занимает около трети всего корпуса слов.

Многие статьи — слова и переводы — были переработанны. И эта работа не останавливается — мы готовим инструмент для себя чтобы иметь возможность вносить оперативно правки в словарные статьи.

Есть ещё большой пул правок, который мы будем вносить. Так что текущая версия словарика, лежащего в основе карточек, очень и очень сильно ушла от старых списков ии продолжает уходить.

А в остпльном… ;)

Илья, спасибо за ответ! Мне как-то Bx Memo сразу понравилась. Когда на экране открыты рабочие окна, а внизу прокручиваются слова - это очень удобно. Дубли в словарях Bx Memo тоже можно отслеживать и удалять.

Dimitri: Мне как-то Bx Memo сразу понравилась.

Там непросто с озвучкой, хотя и решаемо. Но я не помню, чтобы там был реализован метод интервальных повторений. А без него эффективность теряется в разы – это так, я знаком с исследованиями на этот счет, причем не из популярных статей – я читал оригиналы исследований, их много и они доступны в интернете. Либо надо искусственно имитировать повторения, но попасть в оптимальные интервалы “вручную” немыслимо, потому что они определяются для каждого слова индивидуально по довольно замысловатым алгоритмам. И выборки там фильтровать нельзя, насколько я помню, по результатам самопроверок, чтбы дрилить “слабые” слова.

BX Memo хорош, насколько я понимаю, для работы с титрами к фильмам, чтобы оттуда выкусывать фразы и их учить. По-моему, автор пошел в эту сторону.

А вообще это редкий случай живучести продукта, написанного на Delphi, наследнице Turbo Pascal’я. Это такая седая старина, что там даже юникод не поддерживается (и от этого вся эта необходимость определять язык колонок, чтобы подверстывать нужную кодовую страницу).

Но что скрывать! Когда-то эта программа сослужила добрую службу. Но то, что сделали сейчас мы, превосходит ее по возможностям и эффективности. Сделать “летающую” плашку, где листаются слова? Хороший feature request! :))

Что до словариков составленных для нее когда-то, я был бы осторожен, там есть косяки, и немало – говорю так, потому что мы при подготовке наших карточек выгребли оттуда достаточно ошибок и еще осталось (грядет еще одна чистка). Я подозреваю, что они составлялись еще даже до вычитки Арно, француза, который проинспектировал наши транскрипты диалогов и словари. Так что будьте внимательны! :)

урок 33 карточка слова “рождаться” стоит с неправильным произношением
урок 36.2 “улица”, “восток” через телефон почему-то не проигрывается, а через компьютер проигрывается

Друзья, я должен дико извиниться перед вами. Сегодня мы обнаружили, что алгоритм выбора интервала для повторения слов работает некорректно и предлагает их к повторению чрезмерно часто. Мы работаем над устранением этой ошибки и почти пофиксили ее, хотя очередные ошибюочные уведомления еще могут прийти один раз. Я очень надеюсь, что этот косяк не приведет вас к разочарованию во всем нашем проекте. Еще раз извините нас, мы сами узнали об этом только сегодня. Errare humanum est.

Ириса: урок 33 карточка слова “рождаться” стоит с неправильным произношением

Да, произносят - un réveillon

 
Зарегистрируйтесь или войдите чтобы оставить сообщение.