Каталог расширений

Популярные теги

3gp       avi       fb2       jpg       mp3       pdf      

Как записать полное имя файла


имена файлов. Полное, короткое, длинное, корректное и некорректное имя файла, его состав, шаблон и маска

Встретив непонятное словосочетание, читатель, как правило, стремится узнать его значение. Эта статья – краткая экскурсия для пользователя по миру неизведанного.

Общее понятие файла

Долговременная (внешняя) память компьютера хранит все данные в виде файлов. Что же это такое? Файл является именованной последовательностью байтов, состоящих, в свою очередь, из битов. У него есть собственное имя и адрес размещения. Первый параметр указывает человек, а второй - задает и надолго запоминает операционная система. Поиск осуществляется по имени файла, поэтому записывать его адрес пользователю ни к чему.

Бывает так, что информацию не получается найти на компьютерном носителе. Но даже пустой файл имеет собственное имя, являющееся важным свойством записанного на жестком диске набора данных. Если оно отсутствует, то такую структуру нельзя назвать хранением.

Файловая система

Каждый носитель информации (гибкий, жесткий или лазерный диск) может содержать огромное ее количество. Файловая система предназначена для хранения данных и организации различных каталогов. В широком смысле она состоит из совокупности всей информации на диске, наборов структур данных, комплекса системных программных средств. Корневой каталог состоит из вложений 2-го уровня, которые, в свою очередь, включают в себя папки 3-го и т. д. Одноуровневая линейная система применяется для дисков с несколькими файлами, многоуровневая иерархическая – для дисков с их большим количеством. Второй присуща древовидная структура.

Назначение файловой системы

Оно заключается в обеспечении удобного интерфейса для человека при обращении к информации, находящейся на диске, и реализации возможности совместного использования объектов многими людьми и осуществляющимися процессами. Подобное устройство структуры позволяет достичь максимального результата при работе с данными.

Типы файлов

Благодаря определенной информации компьютер приблизительно может «понимать», что находится в наборе данных и с помощью какой программы это можно открыть. Расширение является несколькими буквами или цифрами, находящимися после точки в стандартном имени файла. Оно определяет тип данных и соответствующую программу. Например, информация, записанная на диск с расширением mp3, откроется в проигрывателе. Картинка программы присутствует на изображении файла. По этому значку опытный пользователь сразу понимает, где можно применить указанный тип данных. Документ откроется только в программе, предназначенной для текста. Видеофайлы можно прокрутить в проигрывателе. Информация в виде картинок открывается в графическом редакторе. Существует множество различных файлов. Каждый из них имеет значок, указывающий на соответствующую программу.

Файл: имена файлов

Пользователи дают набору данных на диске символьные названия. По ним идентифицируются файлы. При этом обязательно учитываются ограничения системы как на используемые знаки, так и на всю длину словосочетания. Имя файла – это указанное выше название, которое может совпадать у нескольких наборов данных. В этом случае различной будет последовательность идентификаторов каталогов, то есть адрес, по которому находится информация. В одних системах один и тот же объект не может иметь несколько названий, в других подобное ограничение вообще отсутствует. В последнем случае набору данных предоставляется уникальное имя. Это числовой идентификатор, используемый любыми программами операционной системы.

Состав имени файла

Любая информация на диске содержит в себе несколько элементов. Из чего состоит имя файла? Для того чтобы понять это, необходимо иметь перед глазами образец. Имя файла состоит из двух взаимосвязанных частей: названия и расширения, определяющего тип данных. По нему идентифицируется любая информация на носителе.

Полное имя

Можно привести такой пример:

C:\Музыка\Праздник\Мелодия.mp3.

Указанное в образце полное имя файла – это название, состоящее собственно из него самого и пути информации. Последний из указанных элементов является перечнем идентификаторов папок, которые следует последовательно открыть, чтобы дойти с наивысшего уровня до набора данных. Полное имя файла обязательно задается, начиная с корневого каталога, и содержит в себе перечень всех зависимых вложений остальных уровней. Такое название абсолютное. Оно ссылается на информацию относительно корневого каталога независимо от текущей папки. Все элементы имени разделяются символом косой черты (\). Этот знак должен быть указан перед названием корневого каталога.

Короткое имя

Ограничения операционной системы MS-DOS явились причиной возникновения этого термина. В те времена файл мог иметь только 8 символов в имени. Немного позже появилась возможность ставить точку после названия и дописывать 3 знака расширения.

Это выглядело так:

Мелодия.mp3.

Разработчики стали использовать расширения имен для технических потребностей. С их помощью программы «научились» распознавать тип файла. Эта схема записи имени файла была названа системой 8.3 (по количеству символов названия и расширения, и точка между ними). Она имела ряд недостатков: невозможность использования пробела, знаков препинания, иных букв, кроме английского алфавита. Поэтому создать содержательное название было очень трудно. Краткое имя не содержит символа косой черты (\). По такому названию можно сослаться на данные текущего каталога.

Длинное имя

Раньше, когда на дисках хранились тысячи файлов, пользователи неплохо знали, откуда появились на носителе те или иные данные. В настоящее время следить за историей поступающей информации невозможно. Поэтому для данных были сняты жесткие ограничения на длину названия. Из чего состоит имя файла? Теперь название можно записывать русскими буквами, с некоторыми знаками препинания и даже пробелами. Расширение указывается не только тремя символами. Если имя содержит несколько точек, то тип файла указывается после последнего знака препинания.

Впрочем, традиции содержат в себе великую силу, поэтому на компьютерах не встречаются длинные расширения. Трех символов, чтобы указать тип файла, системе достаточно. В самом длинном имени может быть не менее 250 знаков, хотя это, несомненно, кажется излишеством.

Проблемные объекты

Документ с длинным названием может быть неверно прочитан на другом компьютере. Поэтому при пересылке данных следует переименовать файл с помощью латинских букв. Русского алфавита на компьютере получателя может не оказаться, и вместо словосочетаний появится непонятный набор символов. Для организации системы хранения файлов на личном компьютере пользователя используются любые буквы.

Корректное имя файла

Оно может состоять из любых букв в верхнем и нижнем регистре, числа, точки и подчеркивания. Использование пробела не запрещается. Однако не стоит им злоупотреблять, а также ставить в начало названия. В имя можно включить иные символы, за исключением зарезервированных знаков (> < | ? * / \ : "). Расширение отделяется от названия последней правой точкой. Длина имени ограничивается 255 знаками. На самом деле обычному пользователю хватает 20 символов. Операционная система не различает строчные и прописные буквы в имени файла. Это означает, что сохранить в одном каталоге два элемента с одинаковым названием, написанным в разном регистре, не получится. Так может выглядеть пример совпадающих имен: «Текст.doc» и «ТЕКСТ.doc».

Некорректное название файла

Кроме указанных ограничений, существует запрет на использование зарезервированных имен устройств.

Так, PRN является принтером. COM1-COM4 – устройствами, присоединяемыми к последовательным портам 1-4. AUX выполняет ту же функцию, что и COM1. LPT1-LPT4 являются элементами, присоединяемыми к параллельным портам 1-4 (принтерам), CON (consol) при вводе – клавиатурой, при выводе – экраном, NUL – «пустым» устройством. При попытке пользователя указать зарезервированное название система выдает ошибку. Предупреждение отображается и в том случае, когда используются запрещенные символы. Оно указывает на недопустимое имя файла. Неверно записанная информация о наборе данных не сохраняется, а принимает прежнее значение.

Шаблон названия файла

Командные оболочки операционных систем, а также всевозможные языки программирования позволяют пользователю искать в именах и каталогах определенные группы. Все файлы проверяются на предмет соответствия заданному шаблону, если какой-то из них совпадает с эталоном, то он учитывается, если нет – то пропускается.

Для чего нужен такой образец? Часто требуется осуществить одно и то же действие с целой группой файлов. Это занимает меньше времени, чем обращение к каждому документу по отдельности. Шаблон имени файла позволяет выделить группу, соответствующую заданным требованиям, из общей массы. Он используется даже при поиске данных.

Особые символы

Шаблон имени файла задается с помощью специальных знаков:

  • Звездочка является обозначением любой группы символов. Их количество не имеет значения. К примеру, одна звездочка – это шаблон, которому соответствует вся информация в каталоге. Благодаря команде *.mp3 можно изменить любой однотипный файл. Имена файлов, начинающиеся на my и оканчивающиеся на .txt, выделяются с помощью шаблона my*.txt. Образец *2014* определяет все существующие на компьютере объекты, названия которых содержат в себе группу символов 2014.
  • Знак вопроса является обозначением любого одиночного символа. К примеру, под образец music.??? подойдут начинающиеся на указанное слово данные, имеющие расширение из трех английских букв. В шаблоне na?e.txt вместо стандартного знака вопроса может быть любой символ.

Иные команды

Предусмотрены и другие правила составления образцов. Благодаря включению в команду квадратных скобок ([ ]) с перечнем возможных значений можно сделать поиск более гибким. Если требуется найти какие-либо файлы, начинающиеся с буквы t, не учитывая регистр, то шаблон следует записать так: [tT]*. При поиске данных с именами, идущими по алфавиту, можно создать диапазон. Подобный шаблон выглядит так: [k-zK-Z]?.jpg. Системой будут найдены файлы с указанным типом расширения, имена которых состоят из двух знаков. Причем первая буква k, l, y или z - без учета регистра.

Значение командной оболочки

В одном образце может быть использовано несколько специальных символов. Шаблоны сочетаются со многими командами: просмотром каталогов, копированием файлов, поиском и др. Однако действия осуществляются не с образцом, а с подошедшими под него данными. Нужные объекты отбираются командной оболочкой.

Расширение шаблона является процессом замены символа * на стройную последовательность имен файлов.

Отдельные команды никогда не смогут найти специальный знак в перечне своих параметров. Так что же отвечает за поиск данных? Командная оболочка производит необходимое расширение шаблона таким образом, что будут перечислены все совпадающие с образцом названия файлов.

Маски имен файлов

Они используются в групповых операциях с данными. Маска является последовательностью допустимых в названиях файлов символов, в которых также могут попадаться знак вопроса и звездочка. С ее помощью можно удалить любой имеющийся на компьютере временный файл. Имена файлов в команде могут содержать различные обозначения. Знак вопроса является отметкой одного произвольного символа, а звездочка – целой последовательности. К примеру, воспользовавшись командой rm *mp3, можно удалить все файлы, заканчивающиеся на этот фрагмент. Если потребуется стереть все данные в каталоге, то следует задать команду rm *. Почти так же работает команда с вопросительным знаком, меняется один символ. Маски имен можно использовать и с каталогами.

Проблемное копирование

Переход к длинным именам порождает проблемы совместимости с ранее созданными программами, использующими небольшие словосочетания. Для того чтобы приложения могли открывать информацию в соответствии с принятой ранее структурой хранения, файловая система обязана уметь предоставлять уникальные короткие псевдонимы данным, имеющим сложные названия. Новые операционные системы поддерживают длинные имена. Но иногда пользователь сталкивается с неожиданными проблемами. Копирование файлов с длинными именами может вызвать определенные трудности.

В этом случае не поможет даже создание ярлыка. Обычно от пользователя требуется только переименовать файл и повторить попытку. Как вариант, можно заархивировать данные, скопировать и распаковать. Но что делать, если в сотом подкаталоге, в котором находится требуемый файл, имена файлов такие длинные из-за прописанного в них пути?

Запасные варианты

Если вышеперечисленные методы не подошли, следует просто подключить сетевой диск с помощью щелчка правой кнопки мыши на изображении компьютера и выбора подключения в появившемся меню. При этом необходимо указать букву для желаемого носителя и путь файла.

В крайнем случае пользователь может воспользоваться программой для копирования длинных имен FAR 2.0 и даже отключить Recycle Bin.

Файловая структура диска. Полное имя файла. Работа с файлами

Урок 18. Информатика 7 класс (ФГОС)

В данном видеоуроке рассказывается, что такое путь к файлу и его полное имя. Рассматриваются различные виды файловых структур и случаи их применения. Рассматриваются различные операции над файлами и способы их выполнения.


Конспект урока "Файловая структура диска. Полное имя файла. Работа с файлами"

Урок 8. файл и файловая система - Информатика - 7 класс

Информатика

7 класс

Урок № 8

Файл и файловая система

Перечень вопросов, рассматриваемых в теме:

  • Что такое файл, каталог.
  • Виды файлов.
  • Имена файлов.
  • Каталоги, файловая структура.
  • Графические изображения иерархической файловой структуры.

Тезаурус:

Файл – это поименованная область внешней памяти.

Операции над файлами:

  1. Копирование
  2. Перемещение
  3. Переименование
  4. Удаление
  5. Поиск

Маска представляет собой последовательность букв, цифр и прочих допустимых символов, среди которых также могут встречаться следующие символы:

? – означает ровно один произвольный символ

* – означает любую последовательность символов, в том числе, и пустую.

Каталог – это поименованная совокупность файлов и подкаталогов.

Файловая структура – это совокупность файлов на диске и взаимосвязей между ними.

Простые файловые структуры могут использоваться для дисков с небольшим (до нескольких десятков) количеством файлов.

Иерархические файловые структуры используются для хранения большого (сотни и тысячи) количества файлов.

Графическое изображение иерархической файловой структуры называется деревом.

Последовательно записанные: путь к файлу и имя файла, составляют полное имя файла.

Основная литература:

1. Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.

Дополнительная литература:

  1. Босова Л. Л. Информатика: 7–9 классы. Методическое пособие. // Босова Л. Л., Босова А. Ю., Анатольев А. В., Аквилянов Н.А. – М.: БИНОМ, 2019. – 512 с.
  2. Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 1. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
  3. Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 2. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
  4. Гейн А. Г. Информатика: 7 класс. // Гейн А. Г., Юнерман Н. А., Гейн А.А. – М.: Просвещение, 2012. – 198 с.

Теоретический материал для самостоятельного изучения.

Компьютер человеку даёт большие возможности: создавать, копировать, передавать, хранить информацию различного рода. Данные в компьютере могут быть разными, это и документы, и рисунки, и программы, и музыка и многое другое. Так вот, все данные и программы в компьютере хранятся в виде файлов. Сегодня на уроке мы и узнаем, что такое файл.

Вам уже известно, что все программы и данные хранятся во внешней памяти компьютера в виде файлов. Файл – это поименованная область внешней памяти.

Файл характеризуется набором параметров: именем, размером, датой создания, датой последней модификации и атрибутами, которые используются операционной системой для его обработки: является ли файл системным, скрытым или предназначен только для чтения. Размер файла выражается в байтах.

Файлы, которые содержат данные – графические, текстовые называются документами, а файлы, содержащие прикладные программы, – файлами-приложениями.

Причём, файлы-документы создаются и обрабатываются с помощью файлов-приложений.

Имя файла состоит из двух частей, разделённых точкой: собственно имени файла и расширения. Имя файлу даёт пользователь, делать это нужно осмысленно, отражая в имени содержание файла. Имя файла может содержать до 255 символов национальных алфавитов и пробелы. Но в имени файлов есть и запрещённые символы, например, знак вопроса, звёздочка. Расширение имени файла задаётся программой автоматически, оно содержит 3–4 символа, которые записываются после точки.

Над файлами можно выполнять следующие действия: копирование, перемещение, переименование, удаление, поиск.

Если имя файла указано неточно, то можно использовать маску имени файла. Маска представляет собой последовательность букв, цифр и прочих допустимых символов.

На каждом компьютерном носителе информации может храниться большое количество файлов. Для удобства поиска информации файлы объединяют в группы, называемые каталогами или папками. Каталогам, как и файлам, дают собственные имена. Каждый каталог может содержать множество файлов и вложенных каталогов, может входить в состав другого каталога, тем самым, образуя определённую структуру хранения файлов. Её называют файловой структурой. Файловая структура – это совокупность файлов на диске и взаимосвязей между ними.

Любой информационный носитель операционной системы Windowsимеет корневой каталог, который создаётся без участия человека. Корневые каталоги имеют специальное обозначение с указанием имени соответствующего устройства и знака «\» (обратный слэш).

Простые файловые структуры могут использоваться для дисков с небольшим количеством файлов. В этом случае оглавление диска представляет собой линейную последовательность имён файлов.

Иерархические файловые структуры используются для хранения большого количества файлов. Иерархия – это расположение частей целого в порядке от высшего к низшим. Корневой каталог содержит файлы и вложенные каталоги первого уровня.

Графическое изображение иерархической файловой структуры называется деревом, его можно изображать вертикально и горизонтально.

Чтобы обратиться к нужному файлу, который хранится, например, на жёстком диске, можно указать путь к файлу. То есть имена всех каталогов от корневого до того, в котором находится файл. Такую запись называют полным именем файла.

Разберём задачу:

Учитель работал в каталоге Д:\Уроки\7 класс \Практические работы. Затем перешёл в дереве каталогов на уровень выше, спустился в подкаталог Презентации и удалил из него файл Введение.ppt. Каково полное имя файла, который удалил учитель?

Решение:

Учитель работал с каталогом: Д:\Уроки\7 класс\Практические работы. Поднявшись на один уровень вверх, он оказался в каталоге Д:\Уроки\7 класс. После этого учитель спустился в каталог Презентации, путь к файлам которого имеет вид: D:\Уроки\7 класс \Презентации. В этом каталоге он удалил файл Введение.ppt, полное имя которого Д:\Уроки\7 класс \Презентации\ Введение.ppt.

Итак, сегодня мы узнали, что такое файл, какое имя он может иметь, какие операции можно выполнять над файлами. Также познакомились с понятиями каталог, файловая структура диска.

Материал для углубленного изучения темы.

Файловый менеджер Double Commander.

Double Commander‑ бесплатный файловый менеджер с двухоконным интерфейсом. Программа работает на разных операционных системах: Windows, Linux, MAC OS.

В программу встроены инструменты для группового переименования файлов и синхронизации, все операции выполняются в фоновом режиме, реализована поддержка вкладок, встроен просмотр файлов, эскизов, работа с архивами, расширенный поиск файлов, функция приостановки файловых операций, имеется поддержка некоторых плагинов для TotalCommander и т. д.

Внешний вид DoubleCommader является традиционным для программ подобного типа. Сверху расположены панели инструментов, список дисков, вкладки, собственно, список файлов, внизу находится командная строка и кнопки для тех, кто еще не запомнил наиболее часто используемые файловые операции, но можно скрыть эту панель,

DoubleCommander имеет огромное количество настроек. Настроить можно практически каждый элемент окна, главное найти нужные галочки или поля ввода.

Работа с избранными папками осуществляется с помощью меню, выпадающего при нажатии на кнопку «*». Выглядит оно следующим образом:

Сверху перечислены папки, добавленные в избранные, а снизу два пункта меню для добавления/удаления папки из выбранной панели в список.

Что касается группового переименования, то интерфейс для него выглядит следующим образом:

При переименовании можно использовать регулярные выражения и различные поля вроде счетчика (чтобы добавлять к каждому последующему файлу свой номер), даты, времени создания файла.

В DoubleCommander есть возможность с помощью горячих клавиш (или пункта меню) копировать в буфер обмена имя файла или полный путь до него, Правда, это решается двумя горячими клавишами: сначала переходим к «редактированию пути» в заголовке панели, затем выделенный путь можно скопировать с помощью стандартной комбинации Ctrl+C. Панель быстрого фильтра, позволяет искать файлы/папки в текущей папке, а при необходимости скрыть все файлы и папки, не удовлетворяющие критерию поиска.

 

Для поиска файлов в DoubleCommander довольно удобный интерфейс. Есть возможность вынесения результатов поиска на панель.

Программа DoubleCommander создана коллективом разработчиков из России, которые стремятся создать файловый менеджер, аналогичный по функциональности TotalCommander. Программа активно развивается.

Разбор решения заданий тренировочного модуля.

№1.Тип задания: выделение цветом.

Укажите, какое из указанных ниже имён файлов удовлетворяет маске ?ese*ie.?t*

Варианты ответов:

seseie.ttx

esenie.ttx

eseie.xt

sesenie.txt

Решение:

Так как маска – это последовательность букв, цифр и других, допустимых в именах файлов символов, среди которых встречаются следующие: «?» – означает ровно один последовательный символ, «*» – означает любую (в том числе и пустую) последовательность символов произвольной длины. Рассмотрев маску?ese*ie.?t*, вопросительный знак – это один символ, т.е. s, * – это последовательность символов произвольной длины, т.е. может подойти ответ первый и последний, т.к. * – это ещё и пустой символ. Но, рассматривая расширение, и также рассуждая, последний вариант ответа не подходит, потому что на втором месте стоит буква t. Следовательно, выделяем цветом первый вариант ответа.

Ответ: seseie.ttx

№2.Тип задания: восстановление последовательности элементов.

Восстановите полное имя файла.

Файл Онегин.doc хранится на жёстком диске в каталоге ПОЭЗИЯ, который является подкаталогом каталога ЛИТЕРАТУРА. В таблице приведены фрагменты полного имени файла:

А

Б

В

Д

Е

ЛИТЕРАТУРА

С:

Онегин

.doc

ПОЭЗИЯ

Решение:

Так как, полное имя файла начинается с корневого каталога, то на первом месте будет С:, далее идёт\. Так как, каталог ПОЭЗИЯ является подкаталогом каталога ЛИТЕРАТУРА, то далее пойдёт ЛИТЕРАТУРА, затем ПОЭЗИЯ и разделяются каталоги также обратным слэшем. Ну и, учитывая, что файл Онегин.doc хранится на жёстком диске в каталоге ПОЭЗИЯ, получаем С:\ЛИТЕРАТУРА\ПОЭЗИЯ\Онегин.doc.

Ответ: С:\ЛИТЕРАТУРА\ПОЭЗИЯ\Онегин.doc.

Имя файла - Filename - qaz.wiki

Снимок экрана командной оболочки Windows, показывающий имена файлов в каталоге Список имен файлов с длинными именами файлов, содержащими символы запятой и пробела, как они отображаются на дисплее программного обеспечения.

Имя файла или имя файла - это имя, используемое для однозначной идентификации компьютерного файла, хранящегося в файловой системе . Различные файловые системы накладывают разные ограничения на длину файлов и допустимые символы в именах файлов.

Имя файла может включать один или несколько из этих компонентов:

  • хост (или сервер ) - сетевое устройство, на котором находится файл
  • устройство (или диск ) - аппаратное устройство или диск
  • каталог (или путь ) - дерево каталогов (например, / usr / bin , \ TEMP , [USR.LIB.SRC] и т. д.)
  • file - базовое имя файла
  • тип ( формат или расширение ) - указывает тип содержимого файла (например, .txt , .exe , .COM и т. д.)
  • версия - номер версии или поколения файла

Компоненты, необходимые для идентификации файла, различаются в зависимости от операционной системы, как и синтаксис и формат допустимого имени файла.

Обсуждение имен файлов осложняется отсутствием стандартизации термина. Иногда «имя файла» используется для обозначения полного имени, например, имени Windows c: \ directory \ myfile.txt . Иногда он будет использоваться для ссылки на компоненты, поэтому имя файла в этом случае будет myfile.txt . Иногда это ссылка, исключающая расширение, поэтому имя файла будет просто myfile .

История

Точка (период или полная остановка) в качестве разделителя расширения имени файла, а также ограничение на три буквы расширение, появилась в 1970 - х годах. Они могли исходить из 16-битных ограничений кодировки символов RAD50 .

Традиционно большинство операционных систем поддерживало имена файлов только с прописными буквенно-цифровыми символами, но со временем количество допустимых символов увеличивалось. Это приводило к проблемам совместимости при перемещении файлов между разными файловыми системами.

В 1985 году RFC 959 официально определил путь как строку символов, которая должна быть введена в файловую систему пользователем для идентификации файла.

Примерно в 1995 году VFAT , расширение файловой системы MS-DOS FAT, было представлено в Windows 95 и Windows NT . Он допускал использование длинных имен файлов в Юникоде (LFN) в смешанном регистре в дополнение к классическим именам «8.3».

Миграция Unicode

Одной из проблем был переход на Unicode. Для этой цели несколько компаний-разработчиков программного обеспечения предоставили программное обеспечение для переноса имен файлов в новую кодировку Unicode.

  • Microsoft предоставила прозрачную для пользователя миграцию в рамках технологии VFAT.
  • Apple предоставила «Утилиту восстановления кодировки имен файлов v1.0».
  • Сообщество Linux предоставило « convmv ».

Mac OS X 10.3 ознаменовала принятие Apple декомпозиции символов Unicode 3.2, заменившей использовавшуюся ранее декомпозицию Unicode 2.1. Это изменение вызвало проблемы у разработчиков, пишущих программное обеспечение для Mac OS X.

Ссылки: абсолютные vs относительные

Абсолютная ссылка включает все уровни каталогов. В некоторых системах ссылка на имя файла, которая не включает полный путь к каталогу, по умолчанию указывает на текущий рабочий каталог . Это относительная ссылка. Одним из преимуществ использования относительной ссылки в файлах конфигурации программы или сценариях является то, что разные экземпляры сценария или программы могут использовать разные файлы.

Таким образом, абсолютный или относительный путь состоит из последовательности имен файлов.

Количество имен в файле

Unix-подобные файловые системы позволяют файлу иметь более одного имени; в традиционных файловых системах в стиле Unix имена являются жесткими ссылками на индексный дескриптор файла или его эквивалент. Windows поддерживает жесткие ссылки в файловых системах NTFS и предоставляет команды для их создания fsutilв Windows XP и mklinkболее поздних версиях. Жесткие ссылки отличаются от ярлыков Windows , классических псевдонимов Mac OS / macOS или символических ссылок . Введение LFN с VFAT позволило использовать псевдонимы файлов. Например, longfi ~ 1. ??? с максимум восемью плюс тремя символами был псевдоним имени файла « длинное имя файла. ??? » как способ соответствовать ограничениям 8.3 для старых программ.

Это свойство использовалось алгоритмом команды перемещения, который сначала создает второе имя файла, а затем удаляет только первое имя файла.

Другие файловые системы, по замыслу, предоставляют только одно имя файла для каждого файла, что гарантирует, что изменение файла с одним именем файла не приведет к изменению файла с другим именем.

Ограничения по длине

Некоторые файловые системы ограничивают длину имен файлов. В некоторых случаях эта длина применяется ко всему имени файла, например, 44 символа в IBM S / 370. В других случаях ограничения длины могут применяться к определенным частям имени файла, таким как имя файла в каталоге или имя каталога. Например, 9 (например, 8-битная FAT в автономном диске BASIC ), 11 (например, FAT12 , FAT16 , FAT32 в DOS), 14 (например, ранний Unix), 21 ( Human68K ), 31, 30 (например, Apple DOS 3.2 и 3.3), 15 (например, Apple ProDOS ), 44 (например, IBM S / 370) или 255 (например, ранняя версия Berkeley Unix) символов или байтов. Ограничения длины часто возникают из-за выделения фиксированного пространства в файловой системе для хранения компонентов имен, поэтому увеличение ограничений часто требует несовместимых изменений, а также резервирования большего объема.

Особая проблема с файловыми системами, которые хранят информацию во вложенных каталогах, заключается в том, что можно создать файл с полным путем, превышающим ограничения реализации, поскольку проверка длины может применяться только к отдельным частям имени, а не ко всему имени. Многие приложения Windows ограничены значением MAX_PATH, равным 260, но имена файлов Windows могут легко превысить это ограничение [1] .

Расширения имени файла

Многие файловые системы, включая FAT , NTFS , и VMS системы, позволяют расширение имени файла , который состоит из одного или нескольких символов , следующий за последний период в имени файла, разделяя имя файла на две части: базовое имя или стебель и расширение или суффикс используется некоторыми приложениями для указания типа файла . Несколько выходных файлов, созданных приложением, используют одно и то же базовое имя и разные расширения. Например, компилятор может использовать расширение FORдля исходного входного файла (для кода Fortran), OBJдля вывода объекта и LSTдля листинга. Хотя есть несколько распространенных расширений, они произвольны, и другое приложение может использовать RELи RPT. В файловых системах, которые не разделяют расширения, файлы часто имеют более длинные расширения, например html.

Совместимость кодирования

Не существует общего стандарта кодировки для имен файлов.

Поскольку имена файлов должны обмениваться между программными средами (например, передача файлов по сети, хранение файловой системы, программное обеспечение для резервного копирования и синхронизации файлов, управление конфигурацией, сжатие и архивирование данных и т. Д.), Очень важно не терять информацию об именах файлов между приложениями. . Это привело к широкому распространению Unicode в качестве стандарта для кодирования имен файлов, хотя устаревшее программное обеспечение могло не поддерживать Unicode.

Совместимость индикации кодирования

Традиционно, имена файлов допускали использование любых символов в именах файлов, если они были безопасными для файловой системы. Хотя это позволяло использовать любую кодировку и, таким образом, позволяло представлять любой локальный текст в любой локальной системе, это вызывало множество проблем с совместимостью.

Имя файла может быть сохранено с использованием разных байтовых строк в разных системах в одной стране, например, если в одной из них использовалась японская кодировка Shift JIS и другая японская кодировка EUC . Преобразование было невозможно, так как большинство систем не отображали описание кодировки, используемой для имени файла, как часть расширенной информации о файле. Это заставляло дорогостоящее угадывать кодировку имени файла при каждом доступе к файлу.

Решением было принять Unicode в качестве кодировки имен файлов.

Однако в классической Mac OS кодировка имени файла сохранялась с атрибутами имени файла.

Совместимость с Unicode

Стандарт Unicode решает проблему определения кодировки.

Тем не менее, остаются некоторые ограниченные проблемы совместимости, такие как нормализация (эквивалентность) или используемая версия Unicode. Например, UDF ограничен Unicode 2.0; В файловой системе MacOS HFS + применяется нормализация NFD Unicode и, при необходимости, учитывается регистр (по умолчанию регистр не учитывается). Максимальная длина имени файла нестандартна и может зависеть от размера единицы кода. Хотя это серьезная проблема, в большинстве случаев она ограничена.

В Linux это означает, что имени файла недостаточно для открытия файла: кроме того, требуется точное байтовое представление имени файла на устройстве хранения. Это можно решить на уровне приложения с помощью некоторых сложных вызовов нормализации.

Проблема эквивалентности Unicode известна как «коллизия нормализованных имен». Решением является ненормализующая осведомленность о композиции Unicode, используемая в технических сообществах Subversion и Apache. Это решение не нормализует пути в репозитории. Пути нормализованы только для сравнения. Тем не менее, некоторые сообщества запатентовали эту стратегию, запрещая ее использование другими сообществами.

Перспективы

Чтобы ограничить проблемы совместимости, Sun предлагает следующие идеи:

  • используйте одну кодировку Unicode (например, UTF-8)
  • делать прозрачные преобразования кода для имен файлов
  • не хранить нормализованные имена файлов
  • проверьте каноническую эквивалентность между именами файлов, чтобы избежать двух канонически эквивалентных имен файлов в одном каталоге.

Эти соображения создают ограничение, не позволяющее переключиться на будущую кодировку, отличную от UTF-8.

Уникальность

В пределах одного каталога имена файлов должны быть уникальными. Поскольку синтаксис имени файла также применяется к каталогам, невозможно создать файл и записи каталога с одинаковыми именами в одном каталоге. Несколько файлов в разных каталогах могут иметь одно и то же имя.

Подход к уникальности может отличаться как от чувствительности к регистру, так и от формы нормализации Unicode, такой как NFC, NFD. Это означает, что могут быть созданы два отдельных файла с одним и тем же текстовым именем файла и разной байтовой реализацией имени файла, например L "\ x00C0.txt" (UTF-16, NFC) (латинская заглавная A с могилой) и L "\ x0041 \ x0300.txt "(UTF-16, NFD) (латинская заглавная A, объединение могил).

Сохранение регистра букв

Некоторые файловые системы, такие как FAT , хранят имена файлов в верхнем регистре независимо от регистра букв, использованных для их создания. Например, файл, созданный с именем «MyName.Txt» или «myname.txt», будет сохранен с именем «MYNAME.TXT». Для обозначения одного и того же файла можно использовать любые вариации верхнего и нижнего регистра. Такие файловые системы называются нечувствительными к регистру и не сохраняют регистр . Некоторые файловые системы вообще запрещают использование строчных букв в именах файлов.

Некоторые файловые системы хранят имена файлов в том виде, в котором они были изначально созданы; они называются « сохраняющими дело» или « сохраняющими дело» . Такая файловая система может быть чувствительной к регистру или без учета регистра . Если учитывается регистр, то «MyName.Txt» и «myname.txt» могут относиться к двум разным файлам в одном и том же каталоге, и для ссылки на каждый файл необходимо использовать заглавные буквы, которыми он назван. С другой стороны, в файловой системе без учета регистра и с сохранением регистра только одно из «MyName.Txt», «myname.txt» и «Myname.TXT» может быть именем файла в заданном каталоге в заданное время, и на файл с одним из этих имен можно ссылаться, используя любую заглавную букву имени.

С самого начала Unix и производные от нее системы сохраняли регистр. Однако не все Unix-подобные файловые системы чувствительны к регистру; по умолчанию HFS + в macOS нечувствителен к регистру, а серверы SMB обычно обеспечивают нечувствительность к регистру (даже когда базовая файловая система чувствительна к регистру, например Samba в большинстве Unix-подобных систем), а клиентские файловые системы SMB обеспечивают регистр - бесчувственное поведение. Чувствительность к регистру файловой системы является серьезной проблемой для таких программ, как Samba и Wine , которые должны эффективно взаимодействовать с обеими системами, которые обрабатывают файлы в верхнем и нижнем регистре как разные, и с системами, которые обрабатывают их одинаково.

Зарезервированные символы и слова

Файловые системы не всегда предоставляют одинаковый набор символов для создания имени файла. До того, как Unicode стал стандартом де-факто, файловые системы в основном использовали набор символов, зависящий от локали. Напротив, в некоторых новых системах имя файла может состоять практически из любого символа из репертуара Unicode и даже из некоторых байтовых последовательностей, отличных от Unicode. Ограничения могут быть наложены файловой системой, операционной системой, приложением или требованиями к взаимодействию с другими системами.

Многие утилиты файловой системы запрещают использование управляющих символов в именах файлов. В Unix-подобных файловых системахнулевой символ и разделитель пути /запрещены.

В Windows

Утилиты файловой системы и соглашения об именах в Windows запрещают использование определенных символов в именах файлов:

символ название Причина запрета
/ слэш Используется в качестве разделителя компонентов имени пути в Unix-подобных системах, Windows и Amiga. ( Пока для параметра SwitChar установлено значение '/', оболочка DOS COMMAND.COM будет использовать его как символ переключения, но сами DOS и Windows всегда принимают его как разделитель на уровне API.)
Большой знак ( Кодовая точка Unicode U + 29F8) разрешена в именах файлов Windows.
\ обратная косая черта Используется в качестве разделителя компонентов имени пути по умолчанию в DOS, OS / 2 и Windows (даже если SwitChar установлен в '-'; разрешено в именах файлов Unix, см. Примечание 1 ).
Большой знак обратной черты (U + 29F9) разрешен в именах файлов Windows.
? вопросительный знак Используется как подстановочный знак в Unix, Windows и AmigaOS ; отмечает один символ. Допускается в именах файлов Unix, см. Примечание 1 . Гортанная смычка ʔ (U + 0294), то Interrobang ‽ (U + 203d), то перевернутый вопросительный знак ¿ (U + 00BF) и двойной знак вопроса ⁇ (U + 2047) допускается во всех именах файлов.
% процентов Используется как подстановочный знак в RT-11 ; отмечает одиночный символ. Не особо в Windows.
* звездочка
или звезда
Используется как подстановочный знак в Unix, DOS, RT-11, VMS и Windows. Marks любая последовательность символов (Unix, Windows, DOS) или любой последовательности символов либо базовое имя или расширение (таким образом , «*. *» В DOS означает «все файлы». Разрешено в Unix именах файлов см Примечание 1 .
Оператор Звездочка * (U + 2217) допускается в именах файлов Windows
: двоеточие Используется для определения точки монтирования / диска в Windows; используется для определения виртуального устройства или физического устройства, такого как диск на AmigaOS, RT-11 и VMS; используется в качестве разделителя путей в классической Mac OS . Удваивается после имени в VMS, указывает имя узла DECnet (эквивалент имени хоста NetBIOS (сеть Windows), которому предшествует "\\".). Двоеточие также используется в Windows для отделения альтернативного потока данных от основного файла. Письмо двоеточие ꞉ (U + A789) и символ соотношения : (U + 2236) разрешены в именах файлов Windows. В шрифте Segoe UI , используемом в проводнике Windows , глифы двоеточия и буквы двоеточия идентичны.
| вертикальный стержень
или труба
Обозначает конвейерную обработку программного обеспечения в Unix, DOS и Windows; разрешено в именах файлов Unix, см. Примечание 1 . Стоматологический нажмите | (U + 01C0) допускается в именах файлов Windows.
" прямая двойная кавычка Одинарные кавычки ' (U + 0027) и ' (U + 2019) и изогнутые двойные кавычки « (U + 201C) и » (U + 201D) разрешены в любом месте в именах файлов. См. Примечание 1 .
< меньше, чем Используется для перенаправления ввода , разрешенного в именах файлов Unix, см. Примечание 1 .
> больше чем Используется для перенаправления вывода , разрешенного в именах файлов Unix, см. Примечание 1 .
. Период
или точка
Разрешено, но последнее вхождение будет интерпретировано как разделитель расширений в VMS, DOS и Windows. В других операционных системах это обычно рассматривается как часть имени файла, и может быть разрешено более одной точки (точка). В Unix начальная точка означает, что файл или папка обычно скрыты.
, запятая Разрешено, но рассматривается как разделитель интерпретаторами командной строки COMMAND.COM и CMD.EXE в DOS и Windows.
; точка с запятой Разрешено, но рассматривается как разделитель интерпретаторами командной строки COMMAND.COM и CMD.EXE в DOS и Windows.
= знак равенства Разрешено, но рассматривается как разделитель интерпретаторами командной строки COMMAND.COM и CMD.EXE в DOS и Windows.
Космос
Разрешено, но пробел также используется в качестве разделителя параметров в приложениях командной строки . Это можно решить, указав полное имя файла.

Примечание 1. Хотя они разрешены в именах файлов и папок Unix , для большинства оболочек Unix требуются определенные символы, такие как пробелы, <,>, |, \, а иногда:, (,), &,;, #, а также подстановочные знаки. такие как ? и *, чтобы быть процитированным или экранированным :

five\ and\ six\<seven(пример экранирования)
'five and six<seven'или "five and six<seven"(примеры цитирования)

Символ 0xE5 не разрешался в качестве первой буквы в имени файла в 86-DOS и MS-DOS / PC DOS 1.x-2.x, но может использоваться в более поздних версиях.

В служебных программах Windows нельзя использовать пробел и точку в качестве последнего символа имени файла. Точка разрешена в качестве первого символа, но некоторые приложения Windows, такие как Windows Explorer , запрещают создание или переименование таких файлов (несмотря на то, что это соглашение используется в Unix-подобных системах для описания скрытых файлов и каталогов). Обходные пути включают добавление точки при переименовании файла (которая затем автоматически удаляется), использование альтернативных файловых менеджеров , создание файла с помощью командной строки или сохранение файла с желаемым именем файла из приложения.

Некоторые файловые системы в данной операционной системе (особенно файловые системы, изначально реализованные в других операционных системах) и определенные приложения в этой операционной системе могут применять дополнительные ограничения и интерпретации. Подробнее об ограничениях см. Сравнение файловых систем .

В Unix-подобных системах, DOS и Windows имена файлов "." и ".." имеют особое значение (текущий и родительский каталог соответственно). Windows 95/98 / ME также использует такие имена, как «...», «....» и т. Д. Для обозначения каталогов прародителей или прародителей. Все версии Windows запрещают создание имен файлов, состоящих только из точек, хотя имена, состоящие из трех точек («...») или более, допустимы в Unix.

Кроме того, в утилитах Windows и DOS некоторые слова также зарезервированы и не могут использоваться в качестве имен файлов. Например, файлы устройства DOS :

CON, PRN, AUX, CLOCK$, NUL COM1, COM2, COM3, COM4, COM5, COM6, COM7, COM8, COM9 LPT1, LPT2, LPT3, LPT4, LPT5, LPT6, LPT7, LPT8, LPT9 LST (only in 86-DOS and DOS 1.xx) KEYBD$, SCREEN$ (only in multitasking MS-DOS 4.0) $IDLE$ (only in Concurrent DOS 386, Multiuser DOS and DR DOS 5.0 and higher) CONFIG$ (only in MS-DOS 7.0-8.0) 

Системы, которые имеют эти ограничения, вызывают несовместимость с некоторыми другими файловыми системами. Например, Windows не сможет обработать или создать отчеты об ошибках для этих допустимых имен файлов UNIX: aux.c, q "uote" s.txt или NUL.txt.

Имена файлов NTFS, которые используются для внутреннего использования, включают:

$Mft, $MftMirr, $LogFile, $Volume, $AttrDef, $Bitmap, $Boot, $BadClus, $Secure, $Upcase, $Extend, $Quota, $ObjId and $Reparse 

Сравнение ограничений имени файла

Система С
учетом регистра

Сохранение дела
Допустимый набор символов Зарезервированные персонажи Зарезервированные слова Максимальная длина (символы) Комментарии
8-битный FAT ? ? 7-битный ASCII (но хранится в байтах) первый символ не может быть 0x00 или 0xFF 9 Максимальный предел базового имени 9 символов для последовательных файлов (без расширения) или максимальное расширение 6 и 3 символа для двоичных файлов; см. 6.3 имя файла
FAT12 , FAT16 , FAT32 Нет Нет любая кодовая страница SBCS / DBCS OEM 0x00-0x1F 0x7F "* /: <>? \ | +,.; = [] (В некоторых средах также:! @; DOS 1/2 не допускает 0xE5 в качестве первого символа) Имена устройств, включая: $ IDLE $ AUX COM1… COM4 CONFIG $ CLOCK $ KEYBD $ LPT1… LPT4 LST NUL PRN SCREEN $ (в зависимости от статуса AVAILDEV везде или только в виртуальном каталоге \ DEV \) 11 Максимальный предел базового имени 8 символов и расширение 3 символа; см. 8.3 имя файла
VFAT Нет да Unicode , используя кодировку UCS-2 0x00-0x1F 0x7F "* /: <>? \ | 255
exFAT Нет да Unicode , используя UTF-16 кодирования 0x00-0x1F 0x7F "* /: <>? \ | 255
NTFS По желанию да Unicode , используя UTF-16 кодирования 0x00-0x1F 0x7F "* /: <>? \ | Только в корневом каталоге: $ AttrDef $ BadClus $ Bitmap $ Boot $ LogFile $ MFT $ MFTMirr pagefile.sys $ Secure $ UpCase $ Volume $ Extend $ Extend \ $ ObjId $ Extend \ $ Quota $ Extend \ $ Reparse ($ Extend - это каталог) 255 Пути могут содержать до 32 000 символов.

Запрещает использование символов в диапазоне 1-31 (0x01-0x1F) и символов "* /: <>? \ |, Если имя не помечено как находящееся в пространстве имен Posix. NTFS позволяет каждому компоненту пути (каталог или имя файла) быть Длина 255 символов.

Windows запрещает использование имен устройств MS-DOS AUX, CLOCK $, COM1,…, COM9, CON, LPT1,…, LPT9, NUL и PRN, а также этих имен с любым расширением (например, AUX.txt) , кроме случаев использования длинных путей UNC (например, \\. \ C: \ nul.txt или \\? \ D: \ aux \ con). (CLOCK $ может использоваться, если предоставляется расширение.) Win32 API удаляет конечную точку (точку), а также начальные и конечные символы пробела из имен файлов, за исключением случаев, когда используются пути UNC. Эти ограничения применимы только к Windows; в дистрибутивах Linux, поддерживающих NTFS, имена файлов записываются с использованием пространства имен NTFS Posix, которое допускает любые символы Unicode, кроме / и NUL.

OS / 2 HPFS Нет да любой 8-битный набор | \? * <":> / 254
Mac OS HFS Нет да любой 8-битный набор : 255 старые версии Finder ограничены 31 символом
Mac OS HFS + По желанию да Unicode , используя UTF-16 кодирования : на диске в классической Mac OS и на уровне Carbon в macOS; / на уровне Unix в macOS 255 Mac OS 8.1 - macOS
большинство файловых систем UNIX да да любой 8-битный набор / null 255 ведущий . указывает, что lsи файловые менеджеры не будут отображать файл по умолчанию
z / OS классическая файловая система MVS (наборы данных) Нет Нет Кодовые страницы EBCDIC кроме $ # @ - x'C0 ' 44 первый символ должен быть буквенным или национальным ($, #, @)

«Квалифицированный» содержит не более .8 символов. Наборы многораздельных данных (PDS или PDSE) делятся на элементы с именами длиной до 8 символов; имя члена помещается в скобки после имени PDS, например PAYROLL.DEV.CBL (PROG001)

Файловая система CMS Нет Нет Кодовые страницы EBCDIC 8 + 8 Одноуровневая структура каталогов с буквами дисков (A – Z). Имя файла не более 8 символов и тип файла не более 8 символов, разделенных пробелом. Например, текстовый файл с именем MEMO на диске A будет доступен как «MEMO TEXT A». (В более поздних версиях VM были представлены иерархические структуры файловых систем, SFS и BFS, но исходная плоская структура «минидиск» по-прежнему широко используется.)
ранний UNIX ( AT&T Corporation ) да да любой 8-битный набор / 14 ведущий . указывает на "скрытый" файл
POSIX "Полностью переносимые имена файлов" да да А – Я а – Я 0–9. _ - / значение NULL 14 дефис не должен быть первым символом
ISO 9660 Нет ? А – Я 0–9 _. «около 180» (уровень 2) или 200 (уровень 3) Используется на компакт-дисках; Максимум 8 уровней каталогов (для уровня 1, а не уровня 2,3)
Амига ОФС Нет да любой 8-битный набор : / значение NULL 30 Исходная файловая система 1985 г.
Амига FFS Нет да любой 8-битный набор : / значение NULL 30 Быстрая файловая система 1988
Amiga PFS Нет да любой 8-битный набор : / значение NULL 107 Профессиональная файловая система 1993
Амига SFS Нет да любой 8-битный набор : / значение NULL 107 Умная файловая система 1998
Амига FFS2 Нет да любой 8-битный набор : / значение NULL 107 Быстрая файловая система 2 2002
BeOS BFS да да Unicode , используя UTF-8 кодирование / 255
DEC PDP-11 RT-11 Нет Нет РАДИКС-50 6 + 3 Плоская файловая система без подкаталогов. Полная «спецификация файла» включает устройство, имя файла и расширение (тип файла) в формате: dev: filnam.ext.
DEC VAX VMS Нет Начиная с
версии 7.2
А – Я 0–9 $ - _ 32 на компонент; ранее 9 на компонент; в последнее время 255 для имени файла и 32 для расширения. полная «спецификация файла» включает имя узла, имя диска, каталог / и, имя файла, расширение и версию в формате: OURNODE :: MYDISK: [THISDIR.THATDIR] FILENAME.EXTENSION; 2 Каталоги могут иметь только 8 уровней глубины.
Коммодор DOS да да любой 8-битный набор знак равно $ 16 длина зависит от привода, обычно 16
HP 250 да да любой 8-битный набор ПРОБЕЛ ",: NULL CHR $ (255) 6 К дискам и ленточным накопителям обращаются либо с помощью метки (до 8 символов), либо с помощью спецификации устройства. Файловая система HP 250 не использует каталоги и не использует расширения для обозначения типа файлов. Вместо этого типом является атрибут (например, DATA, PROG, BKUP или SYST для файлов данных, программных файлов, резервных копий и самой ОС).

Смотрите также

Ссылки

  1. ^ a b c d e f Дэвид Робинсо; Иенуп Сун; Николас Уильямс (март 2006 г.). «Презентации Solaris: файловые системы, Unicode и нормализация» (PDF) . Сан-Франциско: Sun.com. Архивировано 4 июля 2012 года (PDF) .
  2. ^ RFC  959 IETF.org RFC  959 , протокол передачи файлов (FTP)
  3. ^ "Утилита восстановления кодировки имен файлов v1.0" . Support.apple.com. 1 июня 2006 . Проверено 2 октября 2018 года .
  4. ^ "convmv - преобразует имена файлов из одной кодировки в другую" . J3e.de . Проверено 17 сентября 2013 года .
  5. ^ «Re: git на MacOSX и файлы с разложенными именами файлов utf-8» . KernelTrap. 7 мая 2010 года Архивировано из оригинального 15 марта 2011 года . Проверено 5 июля 2010 года .
  6. ^ "Страница описания команды Fsutil" . Microsoft.com . Проверено 15 сентября 2013 года .
  7. ^ «Жесткие ссылки NTFS, соединения каталогов и ярлыки Windows» . Гибкий шестигранник . Inv Softworks . Проверено 12 марта 2011 года .
  8. ^ a b «Поддержка ddname с FTP, z / OS V1R11.0 Communications Server IP User's Guide and Commands z / OS V1R10.0-V1R11.0 SC31-8780-09» . IBM.com.
  9. ^ «Имена файлов с акцентами» . Нед Батчелдер . Проверено 17 сентября 2013 года .
  10. ^ "NonNormalizingUnicodeCompositionAwareness - Subversion Wiki" . Wiki.apache.org. 21 января 2013 . Проверено 17 сентября 2013 года .
  11. ^ «Соглашения об именах межплатформенных путей к файлам - Общее программирование» . GameDev.net . Проверено 17 сентября 2013 года .
  12. ^ "CaseInsensitiveFilenames - Официальная вики по Wine" . Wiki.winehq.org. 8 ноября 2009 года Архивировано из оригинального 18 августа 2010 года . Проверено 20 августа 2010 года .
  13. ^ "Базовые спецификации открытой группы, выпуск 6" . IEEE Std 1003.1-2001 . Открытая группа. 2001 г.
  14. ^ «Именование файлов, путей и пространств имен (Windows)» . Msdn.microsoft.com. 26 августа 2013 года . Проверено 17 сентября 2013 года .
  15. ^ «Соглашения об именах Windows» . MSDN , Microsoft.com. См. Последний отмеченный пункт.
  16. ^ a b Именование файла msdn.microsoft.com (MSDN), ограничения имени файла в Windows
  17. ^ Microsoft Windows 95 README for Tips and Tricks , Microsoft , получено 27 августа 2015 г.
  18. ^ Имена драйверов устройств MS-DOS не могут использоваться в качестве имен файлов. , Microsoft
  19. ^ a b Именование файлов, путей и пространств имен , Microsoft
  20. Риттер, Гуннар (30 января 2007 г.). "Сказка о" aux.c " " . Фамильный проект .
  21. ^ «Определение субпараметра, z / OS V1R11.0 MVS JCL Reference» . IBM.com . Проверено 17 сентября 2013 года .
  22. ^ Lewine, Дональд. Руководство программиста POSIX: Написание переносимых программ UNIX 1991 O'Reilly & Associates, Inc. Севастополь, Калифорния, стр. 63-64
  23. ^ Hewlett-Packard Company Roseville, CA Справочник по синтаксису HP 250 Ред. 1/84 Руководство Номер детали 45260-90063

внешние ссылки

Файлы и файловые структуры






§11. О файлах и файловых структурах

Основные темы параграфа:

- что такое файл;
- имя файла;
- логические диски;
- файловая структура диска;
- путь к файлу; полное имя файла;
- просмотр файловой структуры.

Изучаемые вопросы:

- Файл – информация, хранящаяся на внешнем носителе и объединенная общим именем.
- Файловая система как часть ОС.
- Имя файла, правила формирования имени.
- Понятие логического диска.
- Файловая структура диска, понятие каталога.
- Путь к файлу – координата местоположения файла на диске.
- Назначение таблицы размещения файлов


Что такое файл

Информация на внешних носителях хранится в виде файлов.

Файл — это именованная область внешней памяти, предназначенная для хранения информации.

Работа с файлами является очень важным видом работы на компьютере. В файлах хранится все: и программное обеспечение, и информация, необходимая для пользователя. С файлами, как с деловыми бумагами, постоянно приходится что-то делать: переписывать их с одного носителя на другой, уничтожать ненужные, создавать новые, разыскивать, переименовывать, раскладывать в том или другом порядке и пр.

Для прояснения смысла понятия файла удобно воспользоваться следующей аналогией: сам носитель информации (например, диск) подобен книге. Мы говорили о том, что книга — это внешняя память человека, а магнитный диск — внешняя память компьютера. Книга состоит из глав (рассказов, разделов), каждая из которых имеет название. Также и файлы имеют свои названия. Их называют именами файлов. В начале или в конце книги обычно присутствует оглавление — список названий глав. На диске тоже есть такой список-каталог, содержащий имена хранимых файлов.

Каталог можно вывести на экран, чтобы узнать, есть ли на данном диске нужный файл.

В каждом файле хранится отдельный информационный объект: документ, статья, числовой массив, программа и пр. Заключенная в файле информация становится активной, т. е. может быть обработана компьютером, только после того, как она будет загружена в оперативную память.

Все необходимые действия над файлами обеспечивает операционная система.

Чтобы найти нужный файл, пользователю должно быть известно:

а) какое имя у файла;
б) где хранится файл.

Имя файла

Вот пример имени файла *:

myprog.pas

*Последующие примеры ориентированы на правила, принятые в операционных системах фирмы Microsoft: MS-DOS и Windows. Также проиллюстрированы приложения ОС Linux.

Слева от точки находится собственно имя файла (myprog). Следующая за точкой часть имени (pas) называется расширением файла. Обычно в именах файлов употребляются латинские буквы и цифры. Кроме того, имя файла может и не иметь расширения. В операционной системе Microsoft Windows в именах файлов допускается использование русских букв; максимальная длина имени — 255 символов.

Расширение указывает, какого рода информация хранится в данном файле. Например, расширение txt обычно обозначает текстовый файл (содержит текст), расширение рсх — графический файл (содержит рисунок), zip или rаr — архивный файл (содержит архив — сжатую информацию), pas — программу на языке Паскаль.

Файлы, содержащие выполнимые компьютерные программы, имеют расширения ехе или соm. Например, программа игры «Тетрис» может храниться в файле tetris.exe. Инициализация программы происходит путем записи ее в оперативную память и запуска на исполнение.

Логические диски

На одном компьютере может быть несколько дисководов — устройств работы с дисками. Часто на персональном компьютере встроенный в системный блок жесткий диск большой емкости делят на разделы. Каждый из таких разделов называется логическим диском и ему присваивается однобуквенное имя (после которого ставится двоеточие) С:, D:, Е: и т. д. Имена А: и В: обычно относятся к сменным дискам малого объема — гибким дискам (дискетам). Их тоже можно рассматривать как имена логических дисков, каждый из которых полностью занимает реальный (физический) диск *. Следовательно, А:, В:, С:, D: — это всё имена логических дисков.

*На современных моделях ПК гибкие магнитные диски вышли из употребления.

Оптическому дисководу ставится в соответствие следующее по алфавиту имя после имени последнего раздела жесткого диска. Например, если на жестком диске есть разделы С: и D:, то имя Е: будет присвоено оптическому диску. А при подключении флеш-памяти в списке логических дисков появится еще диск F:.

Имя логического диска, содержащего файл, является первой «координатой», определяющей месторасположения файла.

Файловая структура диска

Современные операционные системы поддерживают многоуровневую организацию файлов на дисковых устройствах внешней памяти — иерархическую файловую структуру. Для облегчения понимания этого вопроса воспользуемся аналогией с традиционным «бумажным» способом хранения информации. В такой аналогии файл представляется как некоторый озаглавленный документ (текст, рисунок) на бумажных листах. Следующий элемент файловой структуры называется каталогом. Продолжая «бумажную» аналогию, каталог будем представлять как папку, в которую можно вложить множество документов, т. е. файлов. Каталог также получает собственное имя (представьте, что оно написано на обложке папки).

Каталог сам может входить в состав другого, внешнего по отношению к нему каталога. Это аналогично тому, как папка вкладывается в другую папку большего размера. Таким образом, каждый каталог может содержать внутри себя множество файлов и вложенных каталогов (их называют подкаталогами). Каталог самого верхнего уровня, который не вложен ни в какой другой каталог, называется корневым каталогом.

В операционной системе Windows для обозначения понятия «каталог» используется термин «папка».

Графическое изображение иерархической файловой структуры называется деревом.

На дереве корневой каталог обычно изображается символом \. На рисунке 2.10 имена каталогов записаны прописными буквами, а файлов — строчными. Здесь в корневом каталоге имеются две папки: IVANOV и PETROV и один файл fin.com. Папка IVANOV содержит в себе две вложенные папки PROGS и DATA. Папка DATA пустая; в папке PROGS имеются три файла и т. д.


Путь к файлу

А теперь представьте, что вам нужно найти определенный документ. Для этого в «бумажном» варианте надо знать ящик, в котором он находится, а также «путь» к документу внутри ящика: всю последовательность папок, которые нужно открыть, чтобы добраться до искомых бумаг.

Чтобы найти файл в компьютере, надо знать логический диск, на котором находится файл, и путь к файлу на диске, определяющий положение файла на этом диске. Путь к файлу — это последовательность, состоящая из имен каталогов, начиная от корневого и заканчивая тем, в котором непосредственно хранится файл. Вот всем знакомая сказочная аналогия понятия «путь к файлу»: «На дубе висит сундук, в сундуке — заяц, в зайце — утка, в утке — яйцо, в яйце — игла, на конце которой смерть Кощеева».

И наконец, необходимо знать имя файла. Последовательно записанные имя логического диска, путь к файлу и имя файла составляют полное имя файла.

Если представленная на рис. 2.10 файловая структура хранится на диске С:, то полные имена некоторых входящих в нее файлов в символике операционной системы Microsoft Windows выглядят так:


C:\fin.com
С: \IV ANOV\PROGS\prog 1. pas
С: \PETROV\DATA\task. dat


Просмотр файловой структуры

Операционная система предоставляет пользователю возможность просматривать на экране содержимое каталогов (папок).

Сведения о файловой структуре диска содержатся на этом же диске в виде таблицы размещения файлов. Используя файловую систему ОС, пользователь может последовательно просматривать на экране содержимое каталогов (папок), продвигаясь по дереву файловой структуры вниз или вверх.

На рисунке 2.11 показан пример отображения на экране компьютера дерева каталогов в ОС Windows.

В правом окне представлено содержимое папки ARCON. Это множество файлов различных типов. Отсюда, например, понятно, что полное имя первого в списке файла следующее:

E:\GAME\GAMES\ARCON\dos4gw.exe

Из таблицы можно получить дополнительную информацию о файлах. Например, файл dos4gw.exe имеет размер 254 556 байтов и был создан 31 мая 1994 года в 2 часа 00 минут.

Найдя в таком списке запись о нужном файле, применяя команды ОС, пользователь может выполнить с файлом различные действия: исполнить программу, содержащуюся в файле; удалить, переименовать, скопировать файл. Выполнять все эти операции вы научитесь на практическом занятии.

Коротко о главном

Файл — это именованная область внешней памяти компьютера.

Все необходимые действия над файлами обеспечивает операционная система.

Имя файла состоит из собственно имени и расширения. Расширение указывает на тип информации в файле (тип файла).

Иерархическая файловая структура — многоуровневая организация файлов на дисках.

Каталог — это поименованный перечень файлов и подкаталогов (вложенных каталогов). Каталог самого верхнего уровня называется корневым. Он не вложен ни в какие каталоги.

Полное имя файла состоит из имени логического диска, пути к файлу на диске и имени файла.

Вопросы и задания

1. Как называется операционная система, используемая в вашем компьютерном классе?

2. Сколько физических дисководов работает на ваших компьютерах? Сколько логических дисков находится на физических дисках и какие имена они имеют в операционной системе?

3. Каким правилам подчиняются имена файлов в вашей ОС?

4. Что такое путь к файлу на диске, полное имя файла?

5. Научитесь (под руководством учителя) просматривать на экране каталоги дисков на ваших компьютерах.

6. Научитесь инициализировать работу программ из программных файлов (типа ехе, соm).

7. Научитесь выполнять основные файловые операции в используемой ОС (копирование, перемещение, удаление, переименование файлов).

Электронное приложение к уроку


Вернуться к материалам урока
Презентации, плакаты, текстовые файлы Ресурсы ЕК ЦОР
Видео к уроку

Cкачать материалы урока


Презентация к уроку на тему: Файл. Имя файла

Слайд 1

Государственное бюджетное профессиональное образовательное учреждение среднего профессионального образования Московской области «Красногорский колледж» Щёлковский филиал «Мастер по обработке цифровой информации» МДК 01.01 «Технология создания и обработки цифровой мультимедийной информации «Файл и файловая система» Преподаватель: Мариенкова Елена Васильевна

Слайд 2

Цели : Обучающая: познакомить с понятиями файл, папка, файловая система, имя файла, путь к файлу. Развивающая: формирование умения составлять дерево файловой системы; формирование умения отслеживать путь по файловой системе; развитие познавательных интересов, самоконтроля, умения конспектировать. Воспитательная воспитание информационной культуры, внимательности. Оборудование: Персональный компьютер; мультимедийный проектор и экран ; Данная презентация может быть использована на уроках «Информатика», «Информационные технологии»

Слайд 3

Содержание: Файл. Имя файла. Файловая структура. Путь к файлу. Правила создания имен файлов. Действия с файлами. Маска имени файла. Задания. Источники.

Слайд 4

Файл — это определенное количество информации (программа или данные), имеющее имя и хранящееся в долговременной (внешней) памяти .

Слайд 5

Имя файла состоит из двух частей , разделенных точкой. имя файла и расширение Doclad.txt Имя файла – задает пользователь Расширение – обычно задается программой автоматически при его создании

Слайд 6

В ОС MS-DOS имя файла 8 букв, а расширение из 3 латинских букв, например: proba.txt В ОС Windows имя файла до 255 символов, причем можно использовать русский алфавит, например : Единицы измерения информации.doc

Слайд 7

Таблица расширений файла Тип файла Примеры расширений Системный файл drv , sys Текстовый файл txt, rtf, doc, docx , odt Графический файл bmp, gif, jpg, tif , png , pds Web -страница htm , html Звуковой файл wav, mp3, midi, kar , ogg Видеофайл avi , mpeg Архив zip, rar Электронная таблица xcl , ods Код (текст) программы bas, pas

Слайд 8

Файловая структура вся совокупность файлов на диске и взаимосвязей между ними. Существуют две разновидности файловых структур: одноуровневая и иерархическая

Слайд 9

Каталог список файлов с указанием месторасположения на устройстве хранения информации. Каталог самого верхнего уровня называется корневым . Корневой каталог обозначается латинской буквой с двоеточием C : D : Каталог , в котором пользователь находится в настоящий момент, называется текущим каталогом .

Слайд 10

Путь к файлу Последовательно записанные имя логического диска, путь к файлу и имя файла составляют полное имя файла. C:\basic\prog123.bas C:\ Музыка\Пикник\Иероглиф . mp3

Слайд 11

Правила создания имени файла Разрешается использовать до 255 символов. Разрешается использовать символы национальных алфавитов Разрешается использовать пробелы и другие ранее запрещенные символы, за исключением следующих \: /\:*?"|. В имени файла можно использовать несколько точек. Расширением имени считаются все символы, стоящие за последней точкой.

Слайд 12

Действия с файлами Действия с файлами, как «создать», «сохранить», «закрыть» можно выполнить только в прикладных программах («Блокнот», « Paint », …). Действия «открыть», «переименовать», «переместить», «копировать», «удалить» можно выполнить в системной среде .

Слайд 13

Маска имени файла комбинация специальных символов, которая позволяет легко производить массовый отбор файлов по каким-то общим признакам. Для отбора файлов по маске используются символы: «?» — один произвольный символ «*» — набор произвольных символов

Слайд 14

Выделить все файлы формата mp3 Маска: *.mp3 Результат выборки : песня.mp3, song.mp3 Выделить все файлы с включением слова " курсовик " Маска: * курсовик *.* Результат выборки: мой-курсовик.doc , курсовик-2015.txt Выделить все файлы " курсовик ", игнорируя один первый символ и расширение Маска: ? курсовик .* Результат выборки: 1курсовик.doc, ккурсовик.txt

Слайд 15

Задания: 1.Записать полный путь к файлу. 2.Определить полное имя файла. 3.Определить маску имени файла.

Слайд 16

1. Записать полный путь к файлу . Представлено дерево каталогов , запишите полный путь каждого из файлов.

Слайд 17

2 . Определите полное имя файла. Файл, полное имя которого было C : \txt\test_1.C , сохранили в подкаталоге work корневого каталога диска D :. Каково полное имя сохраненного файла? D : \work\test_1.D D : \ work\txt\test_1.C D : \txt\work\test_1.C D : \ work\test_1.C

Слайд 18

3. Определить маску имени файла. Определите, по какой из перечисленных масок из этих 6 файлов будет отобрана указанная группа файлов: casting.wmv last.wma pasta.wmvx vast.wma 1 ) ?as*.wm? 2) *as?.wm* 3 ) ?as*.wm* 4) ?as*.w*

Слайд 19

Малясова С.В. Информатика и ИКТ: пособие для подготовки К ЕГЭ. – М.: « Академия», 2013 http ://www.5byte.ru http://informikablog.ru http://www.klyaksa.net Источники:

python - попытка записать имя файла в csv

Переполнение стека
  1. Около
  2. Товары
  3. Для команд
  1. Переполнение стека Общественные вопросы и ответы
  2. Переполнение стека для команд Где разработчики и технологи делятся частными знаниями с коллегами
.

c # - Как получить только имя файла из полного имени файла каталога?

Переполнение стека
  1. Около
  2. Товары
  3. Для команд
  1. Переполнение стека Общественные вопросы и ответы
  2. Переполнение стека
.

Как получить путь к файлу, когда я ввожу полное имя файла в javascript?

Переполнение стека
  1. Около
  2. Товары
  3. Для команд
  1. Переполнение стека Общественные вопросы и ответы
  2. Переполнение стека для команд
.

linux - получить список имен файлов определенных расширений и записать измененный вывод в файл

Переполнение стека
  1. Около
  2. Товары
  3. Для команд
  1. Переполнение стека Общественные вопросы и ответы
.

Создание, открытие, чтение, запись и закрытие файла