Repository logo
Article

Web log compression

creativeworkseries.issn1429-3447
dc.contributor.authorGrabowski, Szymon
dc.contributor.authorDeorowicz, Sebastian
dc.date.available2017-08-23T06:52:33Z
dc.date.issued2007
dc.description.abstractWeb log data store client activity on a particular server, usually in form of one-line »hits« with information like the client's IP, date/ time, requested file or query, download size in bytes etc. Web logs of popular sites may grow at the pace of hundreds of megabytes a day, or even more. It makes sense to archive old logs, to analyze them further, e.g. for detecting attacks or other server abuse patterns. In this work we present a specialized lossless Apache web log preprocessor and test it with combination of several popular general-purpose compressors. The test results show the proposed transform improves the compression efficiency of general-purpose compressors on average by 65% in case of gzip and 52% in case of bzip2.en
dc.description.abstractPliki z logami webowymi przechowują zapis aktywności klientów na danym serwerze, zwykle w formie jednolinijkowych wpisów zawierających informacje typu: numer IP maszyny klienta, data/czas dostępu do danego zasobu, rozmiar ściągniętego pliku w bajtach etc. Dane te, na popularnych serwerach www, mogą przyrastać w tempie setek megabajtów na dzień lub nawet wyższym. Archiwizacja »starych« logów jest jednak zalecana, głównie w celu ich analizy, np. mającej na celu wykrywanie ataków sieciowych i nietypowych (niepożądanych) wzorców zachowań. W niniejszej pracy przedstawiamy specjalizowany, zorientowany na kompresję, preprocesor dla logów serwera Apache i testujemy jego efektywność w połączeniu z kilkoma popularnymi kompresorami ogólnego przeznaczenia. Wyniki eksperymentów pokazują, że zaproponowana transformata poprawia efektywność kompresji o 65% (tj. 3-krotnie) w przypadku gzipa oraz o 52% w przypadku kompresora bzip2.pl
dc.description.placeOfPublicationKraków
dc.description.versionwersja wydawnicza
dc.identifier.eissn2353-0952
dc.identifier.issn1429-3447
dc.identifier.nukatdd2008318106
dc.identifier.urihttps://repo.agh.edu.pl/handle/AGH/45958
dc.language.isoeng
dc.publisherWydawnictwa AGH
dc.relation.ispartofAutomatyka
dc.rightsAGH Licence - Fair Use
dc.rights.accessotwarty dostęp
dc.rights.urihttps://repo.uci.agh.edu.pl/info/licence-agh
dc.subjectlossless compressionen
dc.subjectdatabase compressionen
dc.subjectkompresja bezstratnapl
dc.subjectweb logsen
dc.subjectkompresja baz danychpl
dc.subjectlogi webowepl
dc.subjectApacheen
dc.subjectApachepl
dc.titleWeb log compressionen
dc.title.alternativeKompresja logów webowychpl
dc.title.relatedAutomatyka
dc.typeartykuł
dspace.entity.typePublication
publicationissue.issueNumberZ. 3
publicationissue.paginations. 417-424
publicationvolume.volumeNumberT. 11
relation.isJournalIssueOfPublication26357e9b-910d-4944-afb8-7d811aad78b3
relation.isJournalIssueOfPublication.latestForDiscovery26357e9b-910d-4944-afb8-7d811aad78b3
relation.isJournalOfPublicationb16a3604-d334-41d9-9446-dfef1368171d

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Auto36.pdf
Size:
120.68 KB
Format:
Adobe Portable Document Format
Description:
Artykuł z czasopisma