Garl

May 14, 2020

а с этой стороны сейчас посмотрим. и да это был хак конкретно во вьювере конкретно в режиме текста.

upd:

сделано скрытие курсора перед запуском диалога ( по идее как было раньше)

May 13, 2020

кто хотел чтобы во вьювере в текстовом режиме курсор не моргал? пробуем в ночнушке.

May 13, 2020

https://en.wikipedia.org/wiki/Compound_File_Binary_Format

только что взял наисвежайший LibreOffice ну и куча ресурсов в exe по прежнему используют этот контейнер

May 12, 2020

добавлена поддержка compound контейнеров(архивов)

пока снаружи, если научимся детектить их внутри .exe фала - прикрутим и такую поддержку

May 10, 2020

ага есть глюк:

вставляем флэшку

открываем меню выбора диска

вытаскиваем флэшку

Esc + Esc и диск остаётся в панели. как неизвестный

May 10, 2020

Настройки -> менеджер файлов -> установки

May 10, 2020

Ctrl-R спасает? автообновление строки дисков включено?

Как бы воспроизвести?

May 9, 2020

ага спасибо. сделал проверку не на "или" а на "и" что более корректно.

в ночнушке.

так же реализован поиск по юникодовым строкам (пока во вьювере в хекс режиме)

May 9, 2020

3 hours ago, Guest WAJIM said:

ИМХО UTF7 вообще не нужен, не пользуется им никто.

тогда обойдёмся без детекта.

May 8, 2020

читаем теперь весь буфер до трёх UTF8 символов

офф

вот это https://www.php.net/manual/ru/function.imap-utf7-decode.php для определения UTF7 Нас как нибудь помочь сможет?

May 8, 2020

>А почему эта опция по умолчанию отключена?
при сносе инишки она будет включена

>Её ещё и не видно при открытии окна настроек.
поправлено, но изюминка же именно в настройках.

>Вьюер по прежнему при автодетекте кодировки берет список кодировок из редактора вместо своих.

fixed

>Плюс есть глюк: если кодировка KOI отключена, то кодировка WIN не детектится

fixed. но при последующем детекте вьювер уже будет брать кодировку из редактора и наоборот. ( и надо ковырять передачу кодировок через кнопку F11)

>Примеры файлов с UTF8 в аттаче.

fixed (определяем до трёх UTF символов в первых 10 строках. должно хаватить?)

May 8, 2020

можно чуток примеров?

з.ы.

сделал отдельно опцию для детекта кодировки во вьювере

May 8, 2020

в ночнушке : новый детектер UTF8

1 ) по BOM

2) по трём символам больше одного байта в первых двух строках файла (вот тут можно подумать и проверять еще)

на тестовых примерах сработка 100%

May 7, 2020

3 hours ago, Guest WAJIM said:

А сколько байт от начала файла проверяется для определения кодировки? От размера файла зависит?

весь файл (нажмите Alt-F1 в редакторе при сброшеном выделении)

но при 100% найденном BOM дальше детект кодировок не учитывается.

1 hour ago, Guest DRON said:

И что будет с поиском в файлах при включенной "Во всех кодировках": автоопределение или по старинке?

строка будет переводиться в ascii и далее по старому сценарию.

но до поиска пока руки не доходят. тут ещё кучу мелочей допиливать надо.

May 7, 2020

49 minutes ago, Guest DRON said:

Если под "контрольной сумме" понимается BOM

нет, в UTF7 как раз используется BASE64 символов

May 7, 2020

ASCII - как есть

ANSI - [+] по частоте упоминания символов 'а','е','и','о','у' в своей кодировке

KOI - [+] по частоте упоминания символов 'а','е','и','о','у' в своей кодировке

UTF7 - [ - ] если текст только с английскими буквами - перебором со 100% попаданием определить не получится. нужен алгоритм декодирования

UTF8 - [+] BOM - без BOM можно попробовать определять по первым байтам, но если в тексте сперва идут английские буквы - ничего не выйдет

UTF16BE - [+] BOM , без BOM не определяем

UTF16LE - [+] BOM , без BOM не определяем

May 7, 2020

23 hours ago, Guest DRON said:

Это же наоборот самое простое: UTF-7 на то и "семь", что старший бит всегда 0,

берём документацию на английском языке и смотрим: там все буквы со старшим нулевым битом.

так что не совсем катит. надо учиться детектить по контрольной сумме первых байт первой строки

May 6, 2020

из-за отсутствия нормальной реализации utf16 есть шанс не включать его поддержку в сборки.

или нужен человек который сможет реализовать поддержку на ассемблере .

upd:

детект по BOM сделал, но глючит определение строк...

May 6, 2020

но у нас ещё и UTF7 и UTF16BE и UTF16LE

с вот этими и загвоздка

May 5, 2020

Опция детекта кодировки сама просится, соответственно детектить будем из того что разрешено.

нормальный алгоритм детекта кодировок есть откуда взять\подсмотреть?

May 5, 2020

а у вьювера есть настройка автодетекта кодировки?

опция детекта есть только в редакторе.

May 4, 2020

обновите ночнушку плиз это Ж пофикшено.

May 4, 2020

5 hours ago, Guest WAJIM said:

Автодетект кодировки DOS/WIN сломался, постоянно DOS определяет.

а в настройках редкатора\просмотрщика дополнительные кодовые страницы включены?

May 3, 2020

с многобайтовыми концами строк - да засада.

нормально работают только кодовые страницы 65001 и 65000, остальные надо допиливать.

если кто подскажет алгоритм определения по текущему(одному) символу кодовой страницы - буду благодарен

May 2, 2020

UTF16LE\UTF16BE в просмотрщике более-менее , но в редакторе - глючит...

так что пробуем пока на свой страх и риск

Sign In

Garl

Content count

Joined

Last visited

Content Type

Profiles

Forums

Posts posted by Garl

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Hi there

Browse

Activity

Links