LINUX: Может файл, который показывается текстом ASCII, содержат данные UTF-8

Вы, вероятно, не собираетесь любить этот ответ, но эквивалентного VMware, бесплатный гипервизор без операционной системы (ESXI) и клиент управления (vSphere Клиент, также свободный), работал бы в Вашем сценарии. vSphere Клиент работает на XP и предлагает полные возможности управления включая создание VM.

0
задан 10 May 2012 в 19:42
2 ответа

Команда file использует только начало файла для проверки его содержимого (из соображений производительности). Если ваш файл содержит только символы ascii в начале, команда file сообщает файл как ASCII.

Если извлеченный файл содержит символы UTF-8 в начале (или заголовок спецификации), команда сообщает файл как UTF -8 (как во втором примере).

См. Справочную страницу файла для получения дополнительной информации относительно магических чисел и заголовков файлов.

3
ответ дан 4 December 2019 в 11:58

Если вы экспортируете базу данных, содержащую только английский текст и общие управляющие символы, и при экспорте кодируете любые двоичные данные, например, в BASE64, ASCII и UTF-8 будут ТОЧНО одинаковыми, если только существует явная спецификация.

PS: UTF-16 - это другое животное, особенно потому, что он может ВЫГЛЯДИТЬ как совершенно нормальный текст ASCII для некоторых инструментов, будет выглядеть пустым для других и будет бесконечно сбивать с толку других (я видел некоторые версии Perl для чтения и записи прекрасны и полностью не соответствуют тексту с регулярными выражениями ...)

1
ответ дан 4 December 2019 в 11:58

Теги

Похожие вопросы