Web log compression
| creativeworkseries.issn | 1429-3447 | |
| dc.contributor.author | Grabowski, Szymon | |
| dc.contributor.author | Deorowicz, Sebastian | |
| dc.date.available | 2017-08-23T06:52:33Z | |
| dc.date.issued | 2007 | |
| dc.description.abstract | Web log data store client activity on a particular server, usually in form of one-line »hits« with information like the client's IP, date/ time, requested file or query, download size in bytes etc. Web logs of popular sites may grow at the pace of hundreds of megabytes a day, or even more. It makes sense to archive old logs, to analyze them further, e.g. for detecting attacks or other server abuse patterns. In this work we present a specialized lossless Apache web log preprocessor and test it with combination of several popular general-purpose compressors. The test results show the proposed transform improves the compression efficiency of general-purpose compressors on average by 65% in case of gzip and 52% in case of bzip2. | en |
| dc.description.abstract | Pliki z logami webowymi przechowują zapis aktywności klientów na danym serwerze, zwykle w formie jednolinijkowych wpisów zawierających informacje typu: numer IP maszyny klienta, data/czas dostępu do danego zasobu, rozmiar ściągniętego pliku w bajtach etc. Dane te, na popularnych serwerach www, mogą przyrastać w tempie setek megabajtów na dzień lub nawet wyższym. Archiwizacja »starych« logów jest jednak zalecana, głównie w celu ich analizy, np. mającej na celu wykrywanie ataków sieciowych i nietypowych (niepożądanych) wzorców zachowań. W niniejszej pracy przedstawiamy specjalizowany, zorientowany na kompresję, preprocesor dla logów serwera Apache i testujemy jego efektywność w połączeniu z kilkoma popularnymi kompresorami ogólnego przeznaczenia. Wyniki eksperymentów pokazują, że zaproponowana transformata poprawia efektywność kompresji o 65% (tj. 3-krotnie) w przypadku gzipa oraz o 52% w przypadku kompresora bzip2. | pl |
| dc.description.placeOfPublication | Kraków | |
| dc.description.version | wersja wydawnicza | |
| dc.identifier.eissn | 2353-0952 | |
| dc.identifier.issn | 1429-3447 | |
| dc.identifier.nukat | dd2008318106 | |
| dc.identifier.uri | https://repo.agh.edu.pl/handle/AGH/45958 | |
| dc.language.iso | eng | |
| dc.publisher | Wydawnictwa AGH | |
| dc.relation.ispartof | Automatyka | |
| dc.rights | AGH Licence - Fair Use | |
| dc.rights.access | otwarty dostęp | |
| dc.rights.uri | https://repo.uci.agh.edu.pl/info/licence-agh | |
| dc.subject | lossless compression | en |
| dc.subject | database compression | en |
| dc.subject | kompresja bezstratna | pl |
| dc.subject | web logs | en |
| dc.subject | kompresja baz danych | pl |
| dc.subject | logi webowe | pl |
| dc.subject | Apache | en |
| dc.subject | Apache | pl |
| dc.title | Web log compression | en |
| dc.title.alternative | Kompresja logów webowych | pl |
| dc.title.related | Automatyka | |
| dc.type | artykuł | |
| dspace.entity.type | Publication | |
| publicationissue.issueNumber | Z. 3 | |
| publicationissue.pagination | s. 417-424 | |
| publicationvolume.volumeNumber | T. 11 | |
| relation.isJournalIssueOfPublication | 26357e9b-910d-4944-afb8-7d811aad78b3 | |
| relation.isJournalIssueOfPublication.latestForDiscovery | 26357e9b-910d-4944-afb8-7d811aad78b3 | |
| relation.isJournalOfPublication | b16a3604-d334-41d9-9446-dfef1368171d |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Auto36.pdf
- Size:
- 120.68 KB
- Format:
- Adobe Portable Document Format
- Description:
- Artykuł z czasopisma
