- Предпочтительный метод хранения массивов PHP (json_encode vs serialize)
- Ответ 1
- Ответ 2
- Ответ 3
- Ответ 4
- JSON:
- Msgpack
- IgBinary
- serialize / unserialize
- Apache: Как включить кеш браузера для test.json, который переписывает / генерируется через json.php?
- Using PHP Headers When Serving JSON Data
- Common Causes of “Headers Already Sent” Errors
Предпочтительный метод хранения массивов PHP (json_encode vs serialize)
Мне нужно хранить многомерный ассоциативный массив данных в плоском файле для целей кеширования. Иногда я могу столкнуться с необходимостью преобразовать его в JSON для использования в моем веб-приложении, но в подавляющем большинстве случаев я буду использовать массив непосредственно в PHP.
Было бы более эффективно хранить массив как JSON или как сериализованный массив PHP в этом текстовом файле? Я обнаружил, что в новейших версиях PHP (5.3) json_decode на самом деле быстрее, чем unserialize .
В настоящее время я склоняюсь к хранению массива как JSON, так как мне кажется, что его легче читать человеку . Е сли это необходимо, его можно использовать как в PHP, так и в JavaScript с очень небольшими усилиями, а из того, что я читал, это, может быть, даже быстрее декодировать (хотя не уверен в кодировке).
Кто-нибудь знает о подводных камнях? У кого-нибудь есть хорошие тесты, чтобы показать преимущества в производительности любого метода?
Ответ 1
- В отличие от serialize(), вам нужно добавить дополнительный параметр, чтобы сохранить символы UTF-8 нетронутыми: json_encode($array, JSON_UNESCAPED_UNICODE) (иначе он преобразует символы UTF-8 в управляющие последовательности Unicode).
- JSON не будет помнить о том, каким был исходный класс объекта (они всегда восстанавливаются как экземпляры stdClass).
- Вы не сможете использовать __sleep() и __wakeup() с JSON.
- По умолчанию только публичные свойства сериализуются в JSON. (в PHP>=5.4 вы можете реализовать JsonSerializable, чтобы изменить это поведение).
- JSON более переносимый
Ответ 2
- Вы храните глубоко вложенные массивы:: json_decode() «Эта функция вернет false, если данные в кодировке JSON глубже 127 элементов».
- Вы храните объекты, которые необходимо десериализовать, как правильный класс
- Вы взаимодействуете со старыми версиями PHP, которые не поддерживают json_decode
Ответ 3
Вас также может заинтересовать https://github.com/phadej/igbinary, который предоставляет другой « движок » сериализации для PHP. Мои случайные/произвольные цифры « производительности » при использовании PHP 5.3.5 на 64-битной платформе показывают:
JSON:
JSON кодируется за 2.180496931076 секунд
JSON декодируется за 9.8368630409241 секунд
размер сериализованной « строки » : 13993
Родной PHP:
PHP сериализован за 2.9125759601593 секунды
PHP без сериализации за 6.4348418712616 секунд
размер сериализованной « String » : 20769
Бинарный код:
WIN igbinary сериализован за 1.6099879741669 секунд
WIN igbinrary unserialized in 4.7737920284271 seconds
WIN Сериализованная « Строка » Размер : 4467
Таким образом, последний вариант igbinary_serialize() и igbinary_unserialize() быстрее и использует меньше дискового пространства. Я использовал код fillArray(0, 3), как описано выше, но сделал ключи массива более длинными строками. igbinary может хранить те же типы данных, что и родной сериализатор PHP (поэтому нет проблем с объектами и т.д.), и вы можете указать PHP5.3 для использования его для работы с сессиями, если захотите.
Ответ 4
Действительно , это хорошая тема, и после прочтения нескольких ответов я хочу поделиться своими экспериментами по этой теме.
У меня есть пример использования, когда нужно запрашивать какую-то «огромную» таблицу почти каждый раз, когда я обращаюсь к базе данных (не спрашивайте , почему – просто факт). Система кэширования базы данных не подходит, поскольку она не кэширует различные запросы, поэтому я подумал о системах кэширования php.
Я пробовал apcu, но это не соответствовало потребностям, память в этом случае недостаточно надежна. Следующим шагом было кеширование в файл с сериализацией.
В таблице 14355 записей с 18 столбцами, это мои тесты и статистика по чтению сериализованного кеша:
JSON:
Как вы все сказали, главное неудобство с json_encode / json_decode заключается в том, что он все преобразует в экземпляр StdClass (или объект). Если вам нужно его зациклить, вы, вероятно, сделаете преобразование в массив, и да, это увеличит время преобразования:
среднее время: 780,2 мс; использование памяти: 41,5 МБ; размер файла кеша: 3,8 МБ
Msgpack
среднее время: 497 мс; использование памяти: 32 МБ; размер файла кеша: 2,8 МБ
Так лучше, но требуется дополнительное расширение.
IgBinary
Обратите внимание, что я установил, igbinary.compact_strings=Off, потому что меня больше волнует производительность чтения, чем размер файла.
среднее время: 411,4 мс; использование памяти: 36,75 МБ; размер файла кеша: 3,3 МБ
Лучше, чем Msgpack. Тем не менее, этот тоже требует компиляции.
serialize / unserialize
- IgBinary действительно хорош и работает лучше, чем MsgPack;
- Msgpack лучше сжимает ваши данные (обратите внимание, что я не пробовал опцию igbinary compact.string);
- Не хотите компилировать? Используйте стандартные способы.
Мы будем очень благодарны
если под понравившемся материалом Вы нажмёте одну из кнопок социальных сетей и поделитесь с друзьями.
Apache: Как включить кеш браузера для test.json, который переписывает / генерируется через json.php?
Как включить cache браузера для test.json, который переписывает / генерируется через json.php?
К сожалению test.json отвечает заголовками, которые установлены для \.php$ а не \.json$ .
Как правильно применять правила .htaccess, так что test.json, созданный json.php, будет кэшироваться, а при обновлении браузера он вернет 304 Not Modified ? И почему в заголовке ответа по-прежнему отображается Server: Apache когда я использую ServerSignature Off ?
test.json застрял в статусе 200 OK , заголовки ответов:
Date Thu, 17 Feb 2011 10:24:44 GMT Server Apache Content-Encoding gzip Vary Accept-Encoding X-Content-Type-Options nosniff Cache-Control private, max-age=0 Imagetoolbar no Content-Length 88 Keep-Alive timeout=1, max=100 Connection Keep-Alive Content-Type application/json; charset=UTF-8
ServerTokens Prod KeepAliveTimeout 1
Options -Indexes +FollowSymLinks -MultiViews ServerSignature Off php_value output_handler ob_gzhandler AddType application/json .json AddDefaultCharset utf-8 AddCharset utf-8 .json AddOutputFilterByType DEFLATE application/x-httpd-php application/json BrowserMatch ^Mozilla/4 gzip-only-text/html BrowserMatch ^Mozilla/4\.0[678] no-gzip BrowserMatch \bMSIE !no-gzip !gzip-only-text/html mod_gzip_on Yes mod_gzip_can_negotiate Yes mod_gzip_static_suffix .gz AddEncoding gzip .gz mod_gzip_update_static No mod_gzip_keep_workfiles No mod_gzip_minimum_file_size 500 mod_gzip_maximum_file_size 5000000 mod_gzip_maximum_inmem_size 60000 mod_gzip_min_http 1000 mod_gzip_dechunk Yes mod_gzip_handle_methods GET POST mod_gzip_item_include file \.(php|json)$ mod_gzip_item_include mime ^application/x-httpd-php$ mod_gzip_item_include mime ^application/json$ mod_gzip_item_include mime ^httpd/unix-directory$ mod_gzip_item_include handler ^proxy-server$ mod_gzip_item_exclude rspheader ^Content-Encoding:.*gzip.* mod_gzip_send_vary On ExpiresActive On ExpiresDefault "access plus 1 month" ExpiresByType application/x-httpd-php "access plus 0 second" ExpiresByType application/json "access plus 1 day" Header set Cache-Control "private, max-age=0" Header set Imagetoolbar no Header set Cache-Control "public, max-age=31536000" Header append Vary Accept-Encoding FileETag None Header unset ETag Header unset X-Powered-By Header set X-Content-Type-Options: nosniff RewriteEngine On RewriteCond % !-f RewriteCond % !-d RewriteRule ^test.json json.php [L,QSA]
Чтобы включить chaching, добавьте следующее:
ExpiresDefault "access plus 1 month"
Чтобы предотвратить кеширование, выполните следующие действия:
FileETag None Header unset ETag Header set Cache-Control "max-age=0, no-cache, no-store, must-revalidate" Header set Pragma "no-cache" Header set Expires "Wed, 11 Jan 1984 05:00:00 GMT"
Спасибо @Rich Bradshaw, я нашел решение по использованию заголовка PHP в ответе HTTP_IF_MODIFIED_SINCE и HTTP_IF_NONE_MATCH в PHP
function caching_headers($file,$timestamp) < $gmt_mtime=gmdate('r', $timestamp); header('ETag: "'.md5($timestamp.$file).'"'); if(isset($_SERVER['HTTP_IF_MODIFIED_SINCE'])||isset($_SERVER['HTTP_IF_NONE_MATCH']))< if ($_SERVER['HTTP_IF_MODIFIED_SINCE']==$gmt_mtime||str_replace('"','',stripslashes($_SERVER['HTTP_IF_NONE_MATCH']))==md5($timestamp.$file))< header('HTTP/1.1 304 Not Modified'); exit(); >> header('Last-Modified: '.$gmt_mtime); header('Cache-Control: public'); > caching_headers($_SERVER['SCRIPT_FILENAME'],filemtime($_SERVER['SCRIPT_FILENAME']));
Вероятно, нет лучшего / подходящего решения.
Using PHP Headers When Serving JSON Data
Join the DZone community and get the full member experience.
Web browsers and other similar applications rely on headers to understand the content being served to them by a web server. While modern browsers will try to “guess” what format content is in and intelligently format it, it’s still good practice to use headers to ensure your application’s output is handled correctly. When sending a JSON Payload, the header is set using the following PHP code:
header('Content-type: application/json');
It’s important to be aware of a few things when setting headers, however.
First, to avoid the error “Headers already sent”, the headers must be the first thing sent by the web server. It’s a good idea to put any code relating to setting headers at the top of your PHP file to avoid issues caused by your script generating other output before the headers are set.
In addition, consider how you want the browser/client to handle the data. In this sample, we don’t just inform the browser that the data is in JSON format — we also set some instructions to do with caching and expiry.
header('Cache-Control: no-cache, must-revalidate');
This line tells the browser not to cache the data and that it should send a revalidation request each time it wants to load the data to ensure the information it has is still fresh. These instructions are useful for data that is time-sensitive or that changes regularly.
The expires header is used to help the browser know when it needs to re-request data.
header('Expires: Mon, 26 Jul 1997 05:00:00 GMT');
In this example, the expiry date is set to one a long time in the past, telling the server that it should always send a revalidation request. This date and time could be changed to anything the developer wishes. For example, a JSON file detailing class timetables could be set to expire on “Friday evening.” If a user requests the timetable on a Saturday, they’ll see the information for the following week.
Once the headers have been sent, the PHP script can send the JSON payload, confident the application will process it correctly.
Common Causes of “Headers Already Sent” Errors
The most common issue when setting headers in PHP is for the headers to be sent too late in the script. If the script sends any output — even a blank line or whitespace — before the headers are sent, this will result in an error.
It’s common to encounter this error when using a single file for HTML and PHP. Even if the headers are set at the start of the PHP code, if the file has already sent some HTML tags, this means it’s too late to set the headers.
In some cases, the source of the error is not so obvious. PHP code that uses include or require to read additional files could cause an error when setting headers if the other PHP scripts create any output.
Always run any code to do with header instructions before any other code or markup to prevent this error.
Opinions expressed by DZone contributors are their own.