4ee3ac0ec7a1586878af018e9ca999038780e9d2
[imap-fix-internaldate] / src / caching_data.py
1 '''
2 caching_data.py - The module contains the CachingData class.
3
4 Copyright (c) 2012 Intra2net AG
5 Author: Plamen Dimitrov
6
7 This program is free software: you can redistribute it and/or modify
8 it under the terms of the GNU General Public License as published by
9 the Free Software Foundation, either version 3 of the License, or
10 (at your option) any later version.
11
12 This program is distributed in the hope that it will be useful,
13 but WITHOUT ANY WARRANTY; without even the implied warranty of
14 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 GNU General Public License for more details.
16 '''
17 import os, platform, tempfile
18 import pickle
19 import logging
20 from mailbox_state import MailboxState
21
22 CACHE_FILENAME = "message_cache.dat"
23 CACHE_VERSION = "1"
24
25 class CachingData:
26     """This class is responsible for the caching of data."""
27     
28     # class attributes
29     # integer for version of the cache
30     version = None
31     # boolean flag which indicates fallback mode of the cache
32     fallback_to_date_header = None
33     # dictionary of usernames as keys and dictionaries as values
34     # the second dictionaries have unique mailbox keys and mailboxes as values
35     data = None
36
37     def __init__(self, fallback_mode):
38         # open data file or create one and initialize date if not found
39         try:
40             cachefile = open(CACHE_FILENAME, 'rb')
41             cache_info, self.data = pickle.load(cachefile)
42             cache_info = cache_info.split(' ')
43             self.version = cache_info[0]
44             if(self.version != CACHE_VERSION):
45                 logging.warning("Cache file has version %s and the script version is %s. Deleting cache.",
46                                 self.version, CACHE_VERSION)
47                 raise IOError
48             self.fallback_to_date_header = cache_info[1]
49             if(self.fallback_to_date_header != str(fallback_mode)):
50                 logging.warning("Cache file date fallback mode setting is different than current settings. Deleting cache.")
51                 raise IOError
52             logging.info("Cache file %s loaded", CACHE_FILENAME)
53             logging.debug("%s users found.", len(self.data))
54         except IOError:
55             self.version = CACHE_VERSION
56             stored_cache_info = self.version + ' ' + str(fallback_mode)
57             self.data = {}
58             with open(CACHE_FILENAME, 'wb') as cachefile:
59                 pickle.dump((stored_cache_info, self.data), cachefile)
60
61     def __del__(self):
62         # create temporary file first
63         location = os.path.dirname(CACHE_FILENAME)    
64         file_descriptor, tmpname = tempfile.mkstemp(dir=location)
65         try:
66             cachefile = os.fdopen(file_descriptor, 'wb')
67
68             # prepare data based on a save flag
69             saved_data = {}
70             for user in self.data:
71                 saved_data[user] = {}
72                 for box_key in self.data[user]:
73                     if(self.data[user][box_key].needs_save):
74                         saved_data[user][box_key] = self.data[user][box_key]
75                         logging.debug("The mailbox %s will be saved.", saved_data[user][box_key].name)
76                 if(len(saved_data[user])==0):
77                     del saved_data[user]
78                     logging.debug("The user %s will not be saved.", user)
79             self.data = saved_data
80             # avoid test mode or cases where nothing needs saving
81             if(len(saved_data)==0):
82                 cachefile.close()
83                 os.unlink(tmpname)
84                 return
85
86             # serialize in file
87             stored_cache_info = self.version + ' ' + self.fallback_to_date_header
88             pickle.dump((stored_cache_info, self.data), cachefile)
89             logging.debug("%s users stored.", len(self.data))
90
91             # handle windows non-atomic rename
92             if(platform.system()=='Windows'):
93                 if(os.path.exists(CACHE_FILENAME)):
94                     cachefile.close()
95                     os.unlink(CACHE_FILENAME)
96
97             os.rename(tmpname, CACHE_FILENAME)
98         except:
99             os.unlink(tmpname)
100
101         logging.info("Wrote cache file %s", CACHE_FILENAME)
102
103     def retrieve_cached_mailbox(self, name, uidvalidity, user):
104         """Retrieve a cached mailbox or create it."""
105         box_key = name.strip('"') + uidvalidity
106         if(user not in self.data):
107             self.data[user] = {}
108             logging.debug("New user %s cached.", user)
109         if(box_key not in self.data[user]):
110             self.data[user][box_key] = MailboxState(name, uidvalidity, user)
111             logging.debug("New mailbox %s cached.", box_key)
112         return self.data[user][box_key]
113     
114     def report_conflicts(self):
115         """Write a date conflicts report in a file."""
116         with open("conflict_stats.txt", 'w') as statsfile:
117             owner_total_conflicts = {}
118             owner_total_missing = {}
119             for user in self.data:
120                 statsfile.write("user: %s\n" % user)
121                 owner_total_conflicts[user] = 0
122                 owner_total_missing[user] = 0
123                 for box_key in self.data[user]:
124                     owner_total_conflicts[user] += self.data[user][box_key].date_conflicts
125                     owner_total_missing[user] += self.data[user][box_key].no_received_field
126                     statsfile.write("date conflicts: %-15.15s missing header: %-15.15s mailbox: %s\n"\
127                                     % (self.data[user][box_key].date_conflicts,
128                                             self.data[user][box_key].no_received_field,
129                                             self.data[user][box_key].name))
130                 statsfile.write("date conflicts: %-15.15s missing header: %-15.15s TOTAL \n\n"\
131                                 % (owner_total_conflicts[user], owner_total_missing[user]))
132         return