Я даже не пытаюсь предугадать последствия, настолько они ужасны.
Вы обратили внимание на формулировку «обычно обходится без проблем» в предыдущем абзаце? Конечно, обратили. Некоторые векторы устанавливают для своих данных дополнительные ограничения, и при передаче вектора функции API, изменяющей его содержимое, вы должны проследить за тем, чтобы эти ограничения не были нарушены. Например, как объясняется в совете 23, сортируемые векторы часто могут рассматриваться в качестве разумной альтернативы для ассоциативных контейнеров, но при этом содержимое таких векторов должно оставаться правильно отсортированным. При передаче сортируемого вектора функции, способной изменить его содержимое, вам придется учитывать, что при возвращении из функции сортировка элементов может быть нарушена.
Если у вас имеется vector, который должен инициализироваться внутри функции С, можно воспользоваться структурной совместимостью vector с массивами и передать функции указатель на блок элементов вектора:
// Функция fillArray получает указатель на массив.
// содержащий не более arraySize чисел типа double.
// и записывает в него данные. Возвращаемое количество записанных
// чисел заведомо не превышает maxNumDoubles.
size_t fillArray(double *pArray, size_t arraySize);
vector vd(maxNumDoubles); // Создать vector, емкость которого
// равна maxNumDoubles
vd.resize(fillArray(&vd[0], vd.size())); // Заполнить vd вызовом
// функции fillArray. после чего // изменить размер по количеству // записанных элементов
Данный способ подходит только для vector, поскольку только этот контейнер заведомо совместим с массивами по структуре памяти. Впрочем, задача инициализации string функцией С тоже решается достаточно просто. Данные, возвращаемые функцией, заносятся в vector и затем копируются из вектора в string:
// Функция получает указатель на массив, содержащий не более
// arraySize символов, и записывает в него данные.
// Возвращаемое количество записанных чисел заведомо не превышает
// maxNumChars
size_t fillString(char *pArray. sizet arraySize);
vector vc(maxNumChars); // Создать vector, емкость которого
// равна maxNumChars
size_t charsWritten = fillString(&vc[0],vc.size());
// Заполнить vc
// вызовом fillString string s(vc.begin().vc.begin()+charsWritten);
// Скопировать данные
// из vc в s интервальным
// конструктором (совет 5)
Собственно, сам принцип сохранения данных функцией API в vector и их последующего копирования в нужный контейнер STL работает всегда:
size_t fillArray(double *pArray. size_t arraySize); // См. ранее
vector vd(maxNumDoubles);// Также см. ранее
vd.resize(fillArray(&vd[0],vd.size());
deque d(vd.begin().vd.end());// Копирование в deque
list l(vd.begin().vd.end());// Копирование в list
set s(vd.begin(),vd.end()):// Копирование в set
Более того, этот фрагмент подсказывает, как организовать передачу данных из других контейнеров STL, кроме vector и string, функциям С. Для этого достаточно скопировать данные контейнера в vector и передать его при вызове:
void doSomething(const int* pints. size_t numlnts); // Функция С (см. ранее)
set intSet:
// Множество, в котором
// хранятся передаваемые
// данные
vector v(intSet.begin(),intSet.end());// Скопировать данные
// из set в vector
if (!v.empty()) doSomething(&v[0],v.size());// Передать данные
// функции С
Вообще говоря, данные также можно скопировать в массив и передать их функции С, но зачем это нужно? Если размер контейнера не известен на стадии компиляции, память придется выделять динамически, а в совете 13 объясняется, почему вместо динамических массивов следует использовать vector.
Совет 17. Используйте «фокус с перестановкой» для уменьшения емкости
Предположим, вы пишете программу для нового телешоу «Бешеные деньги». Информация о потенциальных участниках хранится в векторе:
class Contestant {...};
vector contestants;
При объявлении набора участников заявки сыплются градом, и вектор быстро заполняется элементами. Но по мере отбора перспективных кандидатов относительно небольшое количество элементов перемещается в начало вектора (вероятно, вызовом partial_sort или partition — см. совет 31), а неудачники удаляются из вектора (как правило, при помощи интервальной формы erase — см. совет 5). В результате удаления длина вектора уменьшается, но емкость остается прежней. Если в какой-то момент времени вектор содержал данные о 100 000 кандидатов, то его емкость останется равной 100 000, даже если позднее количество элементов уменьшится до 10.
Чтобы вектор не удерживал ненужную память, необходимы средства, которые бы позволяли сократить емкость от максимальной до используемой в настоящий момент. Подобное сокращение емкости обычно называется «сжатием по размеру». Сжатие по размеру легко программируется, однако код — как бы выразиться поделикатнее? — выглядит недостаточно интуитивно. Давайте разберемся, как он работает.
Усечение лишней емкости в векторе contestants производится следующим образом:
vector(contestants).swap(contestants);
Выражение vector(contestants) создает временный вектор, содержащий копию contestants; основная работа выполняется копирующим конструктором vector. Тем не менее, копирующий конструктор vector выделяет ровно столько памяти, сколько необходимо для хранения копируемых элементов, поэтому временный вектор не содержит лишней емкости. Затем содержимое вектора contestants меняется местами с временным вектором функцией swap. После завершения этой операции в contestants оказывается содержимое временного вектора с усеченной емкостью, а временный вектор содержит «раздутые» данные, ранее находившиеся в contestants. В этот момент (то есть в конце команды) временный вектор уничтожается, освобождая память, ранее занимаемую вектором contestants.
Аналогичный прием применяется и по отношению к строкам:
string s;
// Создать большую строку и удалить из нее // большую часть символов
string(s).swap(s);// Выполнить "сжатие по размеру" с объектом s
Я не могу предоставить стопроцентной гарантии того, что этом прием действительно удалит из контейнера лишнюю емкость. Авторы реализаций при желании могут намеренно выделить в контейнерах vector и string лишнюю память, и иногда они так и поступают. Например, контейнер может обладать минимальной емкостью или же значения емкости vector/string могут ограничиваться степенями 2 (по собственному опыту могу сказать, что подобные аномалии чаще встречаются в реализациях string, нежели в реализациях vector. За примерами обращайтесь к совету 15). Таким образом, «сжатие по размеру» следует понимать не как «приведение к минимальной емкости», а как «приведение к минимальной емкости, допускаемой реализацией для текущего размера контейнера». Впрочем, это лучшее, что вы можете сделать (не считая перехода на другую реализацию STL), поэтому «сжатие по размеру» для контейнеров vector и string фактически эквивалентно «фокусу с перестановкой».
Кстати говоря, одна из разновидностей «фокуса с перестановкой» может использоваться для очистки контейнера с одновременным сокращением емкости до минимальной величины, поддерживаемой вашей реализацией. Для этого в перестановке используется временный объект vector или string, содержимое которого создается конструктором по умолчанию:
vector v;
string s;
// Использовать v и s
vector ().swap(v); // Очистить v с уменьшением емкости
string().swap(s);// Очистить s с уменьшением емкости
Остается сделать последнее замечание, относящееся к функции
swap
в целом. Перестановка содержимого двух контейнеров также приводит к перестановке их итераторов, указателей и ссылок. Итераторы, указатели и ссылки, относившиеся к элементам одного контейнера, после вызова swap
остаются действительными и указывают на те же элементы — но в другом контейнере.Совет 18. Избегайте vector
Vector как контейнер STL обладает лишь двумя недостатками. Во-первых, это вообще не контейнер STL. Во-вторых, он не содержит bool.
Объект не становится контейнером STL только потому, что кто-то назвал его таковым — он становится контейнером STL лишь при соблюдении всех требований, изложенных в разделе 23.1 Стандарта С++. В частности, в этих требованиях говорится, что если с — контейнер объектов типа Т, поддерживающий оператор