POSIX_FADVISE(2) Руководство программиста Linux POSIX_FADVISE(2)

ИМЯ

posix_fadvise - предварительно декларирует вариант доступа для данных файла

ОБЗОР

#include <fcntl.h>
int posix_fadvise(int fd, off_t offset, off_t len, int advice);

Требования макроса тестирования свойств для glibc (см. feature_test_macros(7)):

posix_fadvise():

_POSIX_C_SOURCE >= 200112L

ОПИСАНИЕ

Программы могут использовать posix_fadvise() для объявления намерений осуществить доступ к файлу данных в скором будущем определённым образом, тем самым позволяя ядру выполнить некоторые операции по оптимизации.

Аргумент advice применяется к (не обязательно существующей) области, начинающейся с offset, длиной len байт (или до конца файла, если len равно 0) внутри файла, на который ссылается fd. Аргумент advice не является привязкой; он всего лишь выражает ожидание приложения.

Допустимые значения advice:

Указывает, что приложение не может подсказать тип доступа для указанных данных. Если не указано предположение для открываемого файла, то используется предположение по умолчанию.
Приложение ожидает последовательный доступ к указанным данным (чтение выполняется начиная с младших адресов).
Указанные данные будут запрашиваться в случайном порядке.
Указанные данные будут запрошены только один раз.
В ядрах до версии 2.6.18, для POSIX_FADV_NOREUSE использовалась такая же семантика что и у POSIX_FADV_WILLNEED. Это, вероятно, было дефектом; начиная с ядра 2.6.18 для этого флага нет операции.
Указанные данные будут запрошены в скором будущем.
При POSIX_FADV_WILLNEED запускается неблокировочное чтение указанной области в страницу кэша. Число неблокированных данных может быть уменьшено ядром в зависимости от загрузки виртуальной памяти (несколько мегабайт памяти наверняка будут выделены, а больше, обычно, и не бывает нужно).
Указанные данные не будут запрошены в скором будущем.
При указании POSIX_FADV_DONTNEED вызов пытается высвободить кэшированные страницы, связанные с указанной областью. Это полезно, например, при потоковой обработке больших файлов. Программа может периодически запрашивать ядро об освобождении уже использованных кэшированных данных, так что полезные кэшированные страницы не будут освобождаться.
Запросы на удаление частичных страниц игнорируются. Предпочтительней сохранять необходимые данные, а не удалять ненужные. Если приложению требуется, чтобы данные считались подходящими для удаления, то offset и len должны быть выровнены по границе страницы.
Реализация может пытаться записать неактуальные (dirty) страницы указанную область, но это не гарантируется. Все не записанные неактуальные страницы не будут освобождены. Если приложение хочет обязательно освободить неактуальные страницы, то оно сначала должно вызвать fsync(2) или fdatasync(2).

ВОЗВРАЩАЕМОЕ ЗНАЧЕНИЕ

При успешном выполнении возвращается 0. В случае ошибки возвращается номер ошибки.

ОШИБКИ

Аргумент fd не является правильным файловым дескриптором.
Неверное значение advice.
Указанный файловый дескриптор ссылается на канал (pipe) или FIFO (в этом случае в Linux до версии 2.6.16, возвращал EINVAL, хотя согласно POSIX ошибка должна быть ESPIPE).

ВЕРСИИ

Поддержка в ядре впервые появилась в Linux 2.5.60; используемый системный вызов называется fadvise64(). Поддержка в библиотеке glibc появилась в версии 2.2; обёрточная функция называется posix_fadvise().

Начиная с Linux 3.18 поддержка данного системного вызова необязательна, она зависит от того, собрано ли ядро с параметром CONFIG_ADVISE_SYSCALLS.

СООТВЕТСТВИЕ СТАНДАРТАМ

POSIX.1-2001, POSIX.1-2008. Заметим, что в POSIX.1-2003 TC1 тип аргумента len был изменён с size_t на off_t.

ЗАМЕЧАНИЯ

В Linux POSIX_FADV_NORMAL устанавливает окно упреждающего чтения согласно используемому размеру по умолчанию для ниже лежащего устройства; POSIX_FADV_SEQUENTIAL удваивает этот размер, а POSIX_FADV_RANDOM отменяет упреждающее чтение вообще. Эти изменения влияют на весь файл, а не только на указанную его область (но другие открытые обработчики файлов на этом файле не изменяются).

Содержимое буферного кэша ядра может быть очищено через интерфейс /proc/sys/vm/drop_caches, описанный в proc(5).

Можно получить снимок страниц файла, которые располагаются в буферном кэше: открыть файл, отобразить его через mmap(2) и затем применить mincore(2) к отображению.

Отличия между библиотекой C и ядром

Обёрточная функция в библиотеке C называется posix_fadvise(). Используемый ей системный вызов называется fadvise64() (на некоторых архитектурах — fadvise64_64()); разница между ними в том, что в библиотечной функциитип аргумента len равен size_t, а у системного вызова — loff_t.

Варианты, зависящие от архитектуры

На некоторых архитектурах требуется, чтобы 64-битные аргументы были выровнены в подходящей паре регистров (подробности в syscall(2)). На таких архитектурах показанная в СИНТАКСИСЕ форма вызова posix_fadvise() приводила бы пустой трате регистра для заполнения между аргументами fd и offset. Поэтому на этих архитектурах определена версия системного вызова с исправленным порядком аргументов, иначе используется формат как у posix_fadvise().

Например, начиная с Linux 2.6.14, в ARM есть следующий системный вызов:

long arm_fadvise64_64(int fd, int advice,
                      loff_t offset, loff_t len);

Данные, зависящие от архитектуры, детали, обычно, скрываются от приложений в обёрточной функции glibc posix_fadvise(), которая использует соответствующий архитектуре системный вызов.

ДЕФЕКТЫ

В ядрах до версии 2.6.6, если значение len равнялось 0, то это воспринималось дословно как «ноль байт», а не как «все байты до конца файла».

СМОТРИТЕ ТАКЖЕ

fincore(1), mincore(2), readahead(2), sync_file_range(2), posix_fallocate(3), posix_madvise(3)

2019-03-06 Linux