schain Commit - r1254:6b25d3b79646 · Jicamarca Repository

Update ParamReader to support diferent HDF5 files, fix Read/Write Madrigal files

jespinoza -

r1254:6b25d3b79646

parent child

Context file:

r1254:6b25d3b79646

Collapse all files

schainpy/model/io/jroIO_kamisr.py 0 -45

              '''
              Created on Set 9, 2015
              @author: roj-idl71 Karim Kuyeng
              '''
              import os
              import sys
              import glob
              import fnmatch
              import datetime
              import time
              import re
              import h5py
              import numpy
              try:
                  from gevent import sleep
              except:
                  from time import sleep
              from schainpy.model.data.jroheaderIO import RadarControllerHeader, SystemHeader
              from schainpy.model.data.jrodata import Voltage
              from schainpy.model.proc.jroproc_base import ProcessingUnit, Operation
              from numpy import imag
              class AMISRReader(ProcessingUnit):
                  '''
                  classdocs
                  '''
                  def __init__(self):
                      '''
                      Constructor
                      '''
                      ProcessingUnit.__init__(self)
                      self.set = None
                      self.subset = None
                      self.extension_file = '.h5'
                      self.dtc_str = 'dtc'
                      self.dtc_id = 0
                      self.status = True
                      self.isConfig = False
                      self.dirnameList = []
                      self.filenameList = []
                      self.fileIndex = None
                      self.flagNoMoreFiles = False
                      self.flagIsNewFile = 0
                      self.filename = ''
                      self.amisrFilePointer = None
                      self.dataset = None
                      self.profileIndex = 0
                      self.beamCodeByFrame = None
                      self.radacTimeByFrame = None
                      self.dataset = None
                      self.__firstFile = True
                      self.buffer = None
                      self.timezone = 'ut'
                      self.__waitForNewFile = 20
                      self.__filename_online = None
                      #Is really necessary create the output object in the initializer
                      self.dataOut = Voltage()
                  def setup(self,path=None,
                                  startDate=None,
                                  endDate=None,
                                  startTime=None,
                                  endTime=None,
                                  walk=True,
                                  timezone='ut',
                                  all=0,
                                  code = None,
                                  nCode = 0,
                                  nBaud = 0,
                                  online=False):
                      self.timezone = timezone
                      self.all = all
                      self.online = online
                      self.code = code
                      self.nCode = int(nCode)
                      self.nBaud = int(nBaud)
                      #self.findFiles()
                      if not(online):
                          #Busqueda de archivos offline
                          self.searchFilesOffLine(path, startDate, endDate, startTime, endTime, walk)
                      else:
                          self.searchFilesOnLine(path, startDate, endDate, startTime,endTime,walk)
                      if not(self.filenameList):
                          print("There is no files into the folder: %s"%(path))
                          sys.exit(-1)
                      self.fileIndex = -1
                      self.readNextFile(online)
                      '''
                      Add code
                      '''
                      self.isConfig = True
                      pass
                  def readAMISRHeader(self,fp):
                      header = 'Raw11/Data/RadacHeader'
                      self.beamCodeByPulse = fp.get(header+'/BeamCode') # LIST OF BEAMS PER PROFILE, TO BE USED ON REARRANGE
                      self.beamCode = fp.get('Raw11/Data/Beamcodes') # NUMBER OF CHANNELS AND IDENTIFY POSITION TO CREATE A FILE WITH THAT INFO
                      #self.code = fp.get(header+'/Code') # NOT USE FOR THIS
                      self.frameCount = fp.get(header+'/FrameCount')# NOT USE FOR THIS
                      self.modeGroup = fp.get(header+'/ModeGroup')# NOT USE FOR THIS
                      self.nsamplesPulse = fp.get(header+'/NSamplesPulse')# TO GET NSA OR USING DATA FOR THAT
                      self.pulseCount = fp.get(header+'/PulseCount')# NOT USE FOR THIS
                      self.radacTime = fp.get(header+'/RadacTime')# 1st TIME ON FILE ANDE CALCULATE THE REST WITH IPP*nindexprofile
                      self.timeCount = fp.get(header+'/TimeCount')# NOT USE FOR THIS
                      self.timeStatus = fp.get(header+'/TimeStatus')# NOT USE FOR THIS
                      self.rangeFromFile = fp.get('Raw11/Data/Samples/Range')
                      self.frequency =  fp.get('Rx/Frequency')
                      txAus = fp.get('Raw11/Data/Pulsewidth')
                      self.nblocks = self.pulseCount.shape[0] #nblocks
                      self.nprofiles = self.pulseCount.shape[1] #nprofile
                      self.nsa = self.nsamplesPulse[0,0] #ngates
                      self.nchannels = self.beamCode.shape[1]
                      self.ippSeconds = (self.radacTime[0][1] -self.radacTime[0][0]) #Ipp in seconds
                      #self.__waitForNewFile = self.nblocks  # wait depending on the number of blocks since each block is 1 sec
                      self.__waitForNewFile = self.nblocks * self.nprofiles * self.ippSeconds # wait until new file is created
                      #filling radar controller header parameters
                      self.__ippKm = self.ippSeconds *.15*1e6 # in km
                      self.__txA = (txAus.value)*.15 #(ipp[us]*.15km/1us) in km
                      self.__txB = 0
                      nWindows=1
                      self.__nSamples = self.nsa
                      self.__firstHeight = self.rangeFromFile[0][0]/1000 #in km
                      self.__deltaHeight = (self.rangeFromFile[0][1] - self.rangeFromFile[0][0])/1000
                      #for now until understand why the code saved is different (code included even though code not in tuf file)
                      #self.__codeType = 0
                     # self.__nCode = None
                     # self.__nBaud = None
                      self.__code = self.code
                      self.__codeType = 0
                      if self.code != None:
                          self.__codeType = 1
                      self.__nCode = self.nCode
                      self.__nBaud = self.nBaud
                      #self.__code = 0
                      #filling system header parameters
                      self.__nSamples = self.nsa
                      self.newProfiles = self.nprofiles/self.nchannels
                      self.__channelList = list(range(self.nchannels))
                      self.__frequency = self.frequency[0][0]
                  def createBuffers(self):
                      pass
                  def __setParameters(self,path='', startDate='',endDate='',startTime='', endTime='', walk=''):
                      self.path = path
                      self.startDate = startDate
                      self.endDate = endDate
                      self.startTime = startTime
                      self.endTime = endTime
                      self.walk = walk
                  def __checkPath(self):
                      if os.path.exists(self.path):
                          self.status = 1
                      else:
                          self.status = 0
                          print('Path:%s does not exists'%self.path)
                      return
                  def __selDates(self, amisr_dirname_format):
                      try:
                          year = int(amisr_dirname_format[0:4])
                          month = int(amisr_dirname_format[4:6])
                          dom = int(amisr_dirname_format[6:8])
                          thisDate = datetime.date(year,month,dom)
                          if (thisDate>=self.startDate and thisDate <= self.endDate):
                              return amisr_dirname_format
                      except:
                          return None
                  def __findDataForDates(self,online=False):
                      if not(self.status):
                          return None
                      pat = '\d+.\d+'
                      dirnameList = [re.search(pat,x) for x in os.listdir(self.path)]
                      dirnameList = [x for x in dirnameList if x!=None]
                      dirnameList = [x.string for x in dirnameList]
                      if not(online):
                          dirnameList = [self.__selDates(x) for x in dirnameList]
                          dirnameList = [x for x in dirnameList if x!=None]
                      if len(dirnameList)>0:
                          self.status = 1
                          self.dirnameList = dirnameList
                          self.dirnameList.sort()
                      else:
                          self.status = 0
                          return None
                  def __getTimeFromData(self):
                      startDateTime_Reader = datetime.datetime.combine(self.startDate,self.startTime)
                      endDateTime_Reader = datetime.datetime.combine(self.endDate,self.endTime)
                      print('Filtering Files from %s to %s'%(startDateTime_Reader, endDateTime_Reader))
                      print('........................................')
                      filter_filenameList = []
                      self.filenameList.sort()
                      #for i in range(len(self.filenameList)-1):
                      for i in range(len(self.filenameList)):
                          filename = self.filenameList[i]
                          fp = h5py.File(filename,'r')
                          time_str = fp.get('Time/RadacTimeString')
                          startDateTimeStr_File = time_str[0][0].split('.')[0]
                          junk = time.strptime(startDateTimeStr_File, '%Y-%m-%d %H:%M:%S')
                          startDateTime_File = datetime.datetime(junk.tm_year,junk.tm_mon,junk.tm_mday,junk.tm_hour, junk.tm_min, junk.tm_sec)
                          endDateTimeStr_File = time_str[-1][-1].split('.')[0]
                          junk = time.strptime(endDateTimeStr_File, '%Y-%m-%d %H:%M:%S')
                          endDateTime_File = datetime.datetime(junk.tm_year,junk.tm_mon,junk.tm_mday,junk.tm_hour, junk.tm_min, junk.tm_sec)
                          fp.close()
                          if self.timezone == 'lt':
                              startDateTime_File = startDateTime_File - datetime.timedelta(minutes = 300)
                              endDateTime_File = endDateTime_File - datetime.timedelta(minutes = 300)
                          if (endDateTime_File>=startDateTime_Reader and endDateTime_File<endDateTime_Reader):
                              #self.filenameList.remove(filename)
                              filter_filenameList.append(filename)
                          if (endDateTime_File>=endDateTime_Reader):
                              break
                      filter_filenameList.sort()
                      self.filenameList = filter_filenameList
                      return 1
                  def __filterByGlob1(self, dirName):
                      filter_files = glob.glob1(dirName, '*.*%s'%self.extension_file)
                      filter_files.sort()
                      filterDict = {}
                      filterDict.setdefault(dirName)
                      filterDict[dirName] = filter_files
                      return filterDict
                  def __getFilenameList(self, fileListInKeys, dirList):
                      for value in fileListInKeys:
                          dirName = list(value.keys())[0]
                          for file in value[dirName]:
                              filename = os.path.join(dirName, file)
                              self.filenameList.append(filename)
                  def __selectDataForTimes(self, online=False):
                      #aun no esta implementado el filtro for tiempo
                      if not(self.status):
                          return None
                      dirList = [os.path.join(self.path,x) for x in self.dirnameList]
                      fileListInKeys = [self.__filterByGlob1(x) for x in dirList]
                      self.__getFilenameList(fileListInKeys, dirList)
                      if not(online):
                          #filtro por tiempo
                          if not(self.all):
                              self.__getTimeFromData()
                          if len(self.filenameList)>0:
                              self.status = 1
                              self.filenameList.sort()
                          else:
                              self.status = 0
                              return None
                      else:
                          #get the last file - 1
                          self.filenameList = [self.filenameList[-2]]
                      new_dirnameList = []
                      for dirname in self.dirnameList:
                          junk = numpy.array([dirname in x for x in self.filenameList])
                          junk_sum = junk.sum()
                          if junk_sum > 0:
                              new_dirnameList.append(dirname)
                      self.dirnameList = new_dirnameList
                      return 1
                  def searchFilesOnLine(self, path, startDate, endDate, startTime=datetime.time(0,0,0),
                                          endTime=datetime.time(23,59,59),walk=True):
                      if endDate ==None:
                       startDate = datetime.datetime.utcnow().date()
                       endDate = datetime.datetime.utcnow().date()
                      self.__setParameters(path=path, startDate=startDate, endDate=endDate,startTime = startTime,endTime=endTime, walk=walk)
                      self.__checkPath()
                      self.__findDataForDates(online=True)
                      self.dirnameList = [self.dirnameList[-1]]
                      self.__selectDataForTimes(online=True)
                      return
                  def searchFilesOffLine(self,
                                          path,
                                          startDate,
                                          endDate,
                                          startTime=datetime.time(0,0,0),
                                          endTime=datetime.time(23,59,59),
                                          walk=True):
                      self.__setParameters(path, startDate, endDate, startTime, endTime, walk)
                      self.__checkPath()
                      self.__findDataForDates()
                      self.__selectDataForTimes()
                      for i in range(len(self.filenameList)):
                          print("%s" %(self.filenameList[i]))
                      return
                  def __setNextFileOffline(self):
                      idFile = self.fileIndex
                      while (True):
                          idFile += 1
                          if not(idFile < len(self.filenameList)):
                              self.flagNoMoreFiles = 1
                              print("No more Files")
                              return 0
                          filename = self.filenameList[idFile]
                          amisrFilePointer = h5py.File(filename,'r')
                          break
                      self.flagIsNewFile = 1
                      self.fileIndex = idFile
                      self.filename = filename
                      self.amisrFilePointer = amisrFilePointer
                      print("Setting the file: %s"%self.filename)
                      return 1
                  def __setNextFileOnline(self):
                      filename = self.filenameList[0]
                      if self.__filename_online != None:
                          self.__selectDataForTimes(online=True)
                          filename = self.filenameList[0]
                          wait = 0
                          while self.__filename_online == filename:
                              print('waiting %d seconds to get a new file...'%(self.__waitForNewFile))
                              if wait == 5:
                                  return 0
                              sleep(self.__waitForNewFile)
                              self.__selectDataForTimes(online=True)
                              filename = self.filenameList[0]
                              wait += 1
                      self.__filename_online = filename
                      self.amisrFilePointer = h5py.File(filename,'r')
                      self.flagIsNewFile = 1
                      self.filename = filename
                      print("Setting the file: %s"%self.filename)
                      return 1
                  def readData(self):
                      buffer = self.amisrFilePointer.get('Raw11/Data/Samples/Data')
                      re = buffer[:,:,:,0]
                      im = buffer[:,:,:,1]
                      dataset = re + im*1j
                      self.radacTime = self.amisrFilePointer.get('Raw11/Data/RadacHeader/RadacTime')
                      timeset = self.radacTime[:,0]
                      return dataset,timeset
                  def reshapeData(self):
                  #self.beamCodeByPulse, self.beamCode, self.nblocks, self.nprofiles, self.nsa,
                      channels = self.beamCodeByPulse[0,:]
                      nchan = self.nchannels
                      #self.newProfiles = self.nprofiles/nchan #must be defined on filljroheader
                      nblocks = self.nblocks
                      nsamples = self.nsa
                      #Dimensions : nChannels, nProfiles, nSamples
                      new_block = numpy.empty((nblocks, nchan, self.newProfiles, nsamples), dtype="complex64")
                      ############################################
                      for thisChannel in range(nchan):
                          new_block[:,thisChannel,:,:] = self.dataset[:,numpy.where(channels==self.beamCode[0][thisChannel])[0],:]
                      new_block = numpy.transpose(new_block, (1,0,2,3))
                      new_block = numpy.reshape(new_block, (nchan,-1, nsamples))
                      return new_block
                  def updateIndexes(self):
                      pass
                  def fillJROHeader(self):
                      #fill radar controller header
                      self.dataOut.radarControllerHeaderObj = RadarControllerHeader(ippKm=self.__ippKm,
                                                                                    txA=self.__txA,
                                                                                    txB=0,
                                                                                    nWindows=1,
                                                                                    nHeights=self.__nSamples,
                                                                                    firstHeight=self.__firstHeight,
                                                                                    deltaHeight=self.__deltaHeight,
                                                                                    codeType=self.__codeType,
                                                                                    nCode=self.__nCode, nBaud=self.__nBaud,
                                                                                    code = self.__code,
                                                                                    fClock=1)
                      #fill system header
                      self.dataOut.systemHeaderObj = SystemHeader(nSamples=self.__nSamples,
                                                                  nProfiles=self.newProfiles,
                                                                  nChannels=len(self.__channelList),
                                                                  adcResolution=14,
                                                                  pciDioBusWith=32)
                      self.dataOut.type = "Voltage"
                      self.dataOut.data = None
                      self.dataOut.dtype = numpy.dtype([('real','<i8'),('imag','<i8')])
              #        self.dataOut.nChannels = 0
              #        self.dataOut.nHeights = 0
                      self.dataOut.nProfiles = self.newProfiles*self.nblocks
                      #self.dataOut.heightList = self.__firstHeigth + numpy.arange(self.__nSamples, dtype = numpy.float)*self.__deltaHeigth
                      ranges = numpy.reshape(self.rangeFromFile.value,(-1))
                      self.dataOut.heightList =  ranges/1000.0 #km
                      self.dataOut.channelList = self.__channelList
                      self.dataOut.blocksize = self.dataOut.getNChannels() * self.dataOut.getNHeights()
              #        self.dataOut.channelIndexList = None
                      self.dataOut.flagNoData = True
                      #Set to TRUE if the data is discontinuous
                      self.dataOut.flagDiscontinuousBlock = False
                      self.dataOut.utctime = None
                      #self.dataOut.timeZone = -5 #self.__timezone/60  #timezone like jroheader, difference in minutes between UTC and localtime
                      if self.timezone == 'lt':
                          self.dataOut.timeZone = time.timezone / 60. #get the timezone in minutes
                      else:
                          self.dataOut.timeZone = 0 #by default time is UTC
                      self.dataOut.dstFlag = 0
                      self.dataOut.errorCount = 0
                      self.dataOut.nCohInt = 1
                      self.dataOut.flagDecodeData = False #asumo que la data esta decodificada
                      self.dataOut.flagDeflipData = False #asumo que la data esta sin flip
                      self.dataOut.flagShiftFFT = False
                      self.dataOut.ippSeconds = self.ippSeconds
                      #Time interval between profiles
                      #self.dataOut.timeInterval = self.dataOut.ippSeconds * self.dataOut.nCohInt
                      self.dataOut.frequency = self.__frequency
                      self.dataOut.realtime = self.online
                      pass
                  def readNextFile(self,online=False):
                      if not(online):
                          newFile = self.__setNextFileOffline()
                      else:
                          newFile = self.__setNextFileOnline()
                      if not(newFile):
                          return 0
                      #if self.__firstFile:
                      self.readAMISRHeader(self.amisrFilePointer)
                      self.createBuffers()
                      self.fillJROHeader()
                      #self.__firstFile = False
                      self.dataset,self.timeset = self.readData()
                      if self.endDate!=None:
                       endDateTime_Reader = datetime.datetime.combine(self.endDate,self.endTime)
                       time_str = self.amisrFilePointer.get('Time/RadacTimeString')
                       startDateTimeStr_File = time_str[0][0].split('.')[0]
                       junk = time.strptime(startDateTimeStr_File, '%Y-%m-%d %H:%M:%S')
                       startDateTime_File = datetime.datetime(junk.tm_year,junk.tm_mon,junk.tm_mday,junk.tm_hour, junk.tm_min, junk.tm_sec)
                       if self.timezone == 'lt':
                        startDateTime_File = startDateTime_File - datetime.timedelta(minutes = 300)
                       if (startDateTime_File>endDateTime_Reader):
                           return 0
                      self.jrodataset = self.reshapeData()
                      #----self.updateIndexes()
                      self.profileIndex = 0
                      return 1
                  def __hasNotDataInBuffer(self):
                      if self.profileIndex >= (self.newProfiles*self.nblocks):
                          return 1
                      return 0
                  def getData(self):
                      if self.flagNoMoreFiles:
                          self.dataOut.flagNoData = True
                          return 0
                      if self.__hasNotDataInBuffer():
                          if not (self.readNextFile(self.online)):
                              return 0
                      if self.dataset is None: # setear esta condicion cuando no hayan datos por leers
                          self.dataOut.flagNoData = True
                          return 0
                      #self.dataOut.data = numpy.reshape(self.jrodataset[self.profileIndex,:],(1,-1))
                      self.dataOut.data = self.jrodataset[:,self.profileIndex,:]
                      #self.dataOut.utctime = self.jrotimeset[self.profileIndex]
                      #verificar basic header de jro data y ver si es compatible con este valor
                      #self.dataOut.utctime = self.timeset + (self.profileIndex * self.ippSeconds * self.nchannels)
                      indexprof = numpy.mod(self.profileIndex, self.newProfiles)
                      indexblock = self.profileIndex/self.newProfiles
                      #print indexblock, indexprof
                      self.dataOut.utctime = self.timeset[indexblock] + (indexprof * self.ippSeconds * self.nchannels)
                      self.dataOut.profileIndex = self.profileIndex
                      self.dataOut.flagNoData = False
              #         if indexprof == 0:
              #             print self.dataOut.utctime
                      self.profileIndex += 1
                      return self.dataOut.data
                  def run(self, **kwargs):
                      '''
                      This method will be called many times so here you should put all your code
                      '''
                      if not self.isConfig:
                          self.setup(**kwargs)
                          self.isConfig = True
                      self.getData()
-             class Writer(Operation):
-                 '''
-                 classdocs
-                 '''
-                 def __init__(self):
-                     '''
-                     Constructor
-                     '''
-                     self.dataOut = None
-                     self.isConfig = False
-                 def setup(self, dataIn, path, blocksPerFile, set=0, ext=None):
-                     '''
-                     In this method we should set all initial parameters.
-                     Input:
-                         dataIn        :        Input data will also be outputa data
-                     '''
-                     self.dataOut = dataIn
-                     self.isConfig = True
-                     return
-                 def run(self, dataIn, **kwargs):
-                     '''
-                     This method will be called many times so here you should put all your code
-                     Inputs:
-                         dataIn        :        object with the data
-                     '''
-                     if not self.isConfig:
-                         self.setup(dataIn, **kwargs)
-  No newline at end of file

schainpy/model/io/jroIO_madrigal.py +110 -152

              '''
              Created on Aug 1, 2017
              @author: Juan C. Espinoza
              '''
              import os
              import sys
              import time
              import json
              import glob
              import datetime
              import numpy
              import h5py
              import schainpy.admin
-             from schainpy.model.io.jroIO_base import LOCALTIME, JRODataReader, JRODataWriter
+             from schainpy.model.io.jroIO_base import LOCALTIME, Reader
              from schainpy.model.proc.jroproc_base import ProcessingUnit, Operation, MPDecorator
              from schainpy.model.data.jrodata import Parameters
              from schainpy.utils import log
              try:
                  import madrigal.cedar
              except:
                  log.warning(
                      'You should install "madrigal library" module if you want to read/write Madrigal data'
                      )
              try:
                  basestring
              except:
                  basestring = str
              DEF_CATALOG = {
                  'principleInvestigator': 'Marco Milla',
                  'expPurpose': '',
                  'cycleTime': '',
                  'correlativeExp': '',
                  'sciRemarks': '',
                  'instRemarks': ''
                  }
              DEF_HEADER = {
                  'kindatDesc': '',
                  'analyst': 'Jicamarca User',
                  'comments': '',
                  'history': ''
                  }
              MNEMONICS = {
 : 'jro',
 : 'jbr',
 : 'jul',
 : 'jas',
 : 'pbr',
 : 'hbr',
 : 'obr',
 : 'clr'
              }
              UT1970 = datetime.datetime(1970, 1, 1) - datetime.timedelta(seconds=time.timezone)
              def load_json(obj):
                  '''
                  Parse json as string instead of unicode
                  '''
                  if isinstance(obj, str):
                      iterable = json.loads(obj)
                  else:
                      iterable = obj
                  if isinstance(iterable, dict):
                      return {str(k): load_json(v) if isinstance(v, dict) else str(v) if isinstance(v, basestring) else v
                          for k, v in list(iterable.items())}
                  elif isinstance(iterable, (list, tuple)):
                      return [str(v) if isinstance(v, basestring) else v for v in iterable]
                  return iterable
              @MPDecorator
-             class MADReader(JRODataReader, ProcessingUnit):
+             class MADReader(Reader, ProcessingUnit):
                  def __init__(self):
                      ProcessingUnit.__init__(self)
                      self.dataOut = Parameters()
                      self.counter_records = 0
                      self.nrecords = None
                      self.flagNoMoreFiles = 0
-                     self.isConfig = False
                      self.filename = None
                      self.intervals = set()
+                     self.datatime = datetime.datetime(1900,1,1)
+                     self.format = None
+                     self.filefmt = "***%Y%m%d*******"
-                 def setup(self,
-                           path=None,
-                           startDate=None,
-                           endDate=None,
-                           format=None,
-                           startTime=datetime.time(0, 0, 0),
-                           endTime=datetime.time(23, 59, 59),
-                           **kwargs):
+                 def setup(self, **kwargs):
-                     self.path = path
-                     self.startDate = startDate
-                     self.endDate = endDate
-                     self.startTime = startTime
-                     self.endTime = endTime
-                     self.datatime = datetime.datetime(1900,1,1)
-                     self.oneDDict = load_json(kwargs.get('oneDDict',
-                                                          "{\"GDLATR\":\"lat\", \"GDLONR\":\"lon\"}"))
-                     self.twoDDict = load_json(kwargs.get('twoDDict',
-                                                          "{\"GDALT\": \"heightList\"}"))
-                     self.independentParam = 'GDALT'
+                     self.set_kwargs(**kwargs)
+                     self.oneDDict = load_json(self.oneDDict)
+                     self.twoDDict = load_json(self.twoDDict)
+                     self.ind2DList = load_json(self.ind2DList)
+                     self.independentParam = self.ind2DList[0]
                      if self.path is None:
                          raise ValueError('The path is not valid')
-                     if format is None:
+                     self.open_file = open
+                     self.open_mode = 'rb'
+                     if self.format is None:
                          raise ValueError('The format is not valid choose simple or hdf5')
-                     elif format.lower() in ('simple', 'txt'):
+                     elif self.format.lower() in ('simple', 'txt'):
                          self.ext = '.txt'
-                     elif format.lower() in ('cedar',):
+                     elif self.format.lower() in ('cedar',):
                          self.ext = '.001'
                      else:
                          self.ext = '.hdf5'
+                         self.open_file = h5py.File
+                         self.open_mode = 'r'
-                     self.search_files(self.path)
-                     self.fileId = 0
-                     if not self.fileList:
-                         raise  Warning('There is no files matching these date in the folder: {}. \n Check startDate and endDate'.format(path))
-                     self.setNextFile()
-                 def search_files(self, path):
-                     '''
-                      Searching for madrigal files in path
-                      Creating a list of files to procces included in [startDate,endDate]
-                      Input:
-                          path - Path to find files
-                     '''
-                     log.log('Searching files {} in {} '.format(self.ext, path), 'MADReader')
-                     fileList0 = glob.glob1(path, '*{}'.format(self.ext))
-                     fileList0.sort()
-                     self.fileList = []
-                     self.dateFileList = []
-                     startDate = self.startDate - datetime.timedelta(1)
-                     endDate = self.endDate + datetime.timedelta(1)
-                     for thisFile in fileList0:
-                         year = thisFile[3:7]
-                         if not year.isdigit():
-                             continue
-                         month = thisFile[7:9]
-                         if not month.isdigit():
-                             continue
+                     if self.online:
+                         log.log("Searching files in online mode...", self.name)
-                         day = thisFile[9:11]
-                         if not day.isdigit():
-                             continue
+                         for nTries in range(self.nTries):
+                             fullpath = self.searchFilesOnLine(self.path, self.startDate,
+                                 self.endDate, self.expLabel, self.ext, self.walk,
+                                 self.filefmt, self.folderfmt)
-                         year, month, day = int(year), int(month), int(day)
-                         dateFile = datetime.date(year, month, day)
+                             try:
+                                 fullpath = next(fullpath)
+                             except:
+                                 fullpath = None
+                             if fullpath:
+                                 break
-                         if (startDate > dateFile) or (endDate < dateFile):
-                             continue
+                             log.warning(
+                                 'Waiting {} sec for a valid file in {}: try {} ...'.format(
+                                     self.delay, self.path, nTries + 1),
+                                 self.name)
+                             time.sleep(self.delay)
+                         if not(fullpath):
+                             raise schainpy.admin.SchainError(
+                                 'There isn\'t any valid file in {}'.format(self.path))
+                     else:
+                         log.log("Searching files in {}".format(self.path), self.name)
+                         self.filenameList = self.searchFilesOffLine(self.path, self.startDate,
+                             self.endDate, self.expLabel, self.ext, self.walk, self.filefmt, self.folderfmt)
+                     self.setNextFile()
-                         self.fileList.append(thisFile)
-                         self.dateFileList.append(dateFile)
+                 def readFirstHeader(self):
+                     '''Read header and data'''
-                     return
+                     self.parseHeader()
+                     self.parseData()
+                     self.blockIndex = 0
+                     return
                  def parseHeader(self):
                      '''
                      '''
                      self.output = {}
                      self.version = '2'
                      s_parameters = None
                      if self.ext == '.txt':
                          self.parameters = [s.strip().lower() for s in self.fp.readline().decode().strip().split(' ') if s]
                      elif self.ext == '.hdf5':
                          self.metadata = self.fp['Metadata']
                          if '_record_layout' in self.metadata:
                              s_parameters = [s[0].lower().decode() for s in self.metadata['Independent Spatial Parameters']]
                              self.version = '3'
                          self.parameters = [s[0].lower().decode() for s in self.metadata['Data Parameters']]
                      log.success('Parameters found: {}'.format(self.parameters),
                                  'MADReader')
                      if s_parameters:
                          log.success('Spatial parameters found: {}'.format(s_parameters),
                                      'MADReader')
                      for param in list(self.oneDDict.keys()):
                          if param.lower() not in self.parameters:
                              log.warning(
                                  'Parameter {} not found will be ignored'.format(
                                      param),
                                  'MADReader')
                              self.oneDDict.pop(param, None)
                      for param, value in list(self.twoDDict.items()):
                          if param.lower() not in self.parameters:
                              log.warning(
                                  'Parameter {} not found, it will be ignored'.format(
                                      param),
                                  'MADReader')
                              self.twoDDict.pop(param, None)
                              continue
                          if isinstance(value, list):
                              if value[0] not in self.output:
                                  self.output[value[0]] = []
                              self.output[value[0]].append([])
                  def parseData(self):
                      '''
                      '''
                      if self.ext == '.txt':
                          self.data = numpy.genfromtxt(self.fp, missing_values=('missing'))
                          self.nrecords = self.data.shape[0]
                          self.ranges = numpy.unique(self.data[:,self.parameters.index(self.independentParam.lower())])
                          self.counter_records = 0
                      elif self.ext == '.hdf5':
                          self.data = self.fp['Data']
                          self.ranges = numpy.unique(self.data['Table Layout'][self.independentParam.lower()])
                          self.times = numpy.unique(self.data['Table Layout']['ut1_unix'])
                          self.counter_records = int(self.data['Table Layout']['recno'][0])
                          self.nrecords = int(self.data['Table Layout']['recno'][-1])
-                 def setNextFile(self):
-                     '''
-                     '''
-                     file_id = self.fileId
-                     if file_id == len(self.fileList):
-                         log.success('No more files', 'MADReader')
-                         self.flagNoMoreFiles = 1
-                         return 0
-                     log.success(
-                         'Opening: {}'.format(self.fileList[file_id]),
-                         'MADReader'
+                         )
-                     filename = os.path.join(self.path, self.fileList[file_id])
-                     if self.filename is not None:
-                         self.fp.close()
-                     self.filename = filename
-                     self.filedate = self.dateFileList[file_id]
-                     if self.ext=='.hdf5':
-                         self.fp = h5py.File(self.filename, 'r')
-                     else:
-                         self.fp = open(self.filename, 'rb')
-                     self.parseHeader()
-                     self.parseData()
-                     self.sizeOfFile = os.path.getsize(self.filename)
-                     self.flagIsNewFile = 0
-                     self.fileId += 1
-                     return 1
                  def readNextBlock(self):
                      while True:
                          self.flagDiscontinuousBlock = 0
-                         if self.flagIsNewFile:
-                             if not self.setNextFile():
-                                 return 0
+                         if self.counter_records == self.nrecords:
+                             self.setNextFile()
                          self.readBlock()
                          if (self.datatime < datetime.datetime.combine(self.startDate, self.startTime)) or \
                             (self.datatime > datetime.datetime.combine(self.endDate, self.endTime)):
                              log.warning(
                                  'Reading Record No. {}/{} -> {} [Skipping]'.format(
                                      self.counter_records,
                                      self.nrecords,
                                      self.datatime.ctime()),
                                  'MADReader')
                              continue
                          break
                      log.log(
                          'Reading Record No. {}/{} -> {}'.format(
                              self.counter_records,
                              self.nrecords,
                              self.datatime.ctime()),
                          'MADReader')
                      return 1
                  def readBlock(self):
                      '''
                      '''
                      dum = []
                      if self.ext == '.txt':
                          dt = self.data[self.counter_records][:6].astype(int)
                          if datetime.datetime(dt[0], dt[1], dt[2], dt[3], dt[4], dt[5]).date() > self.datatime.date():
                              self.flagDiscontinuousBlock = 1
                          self.datatime = datetime.datetime(dt[0], dt[1], dt[2], dt[3], dt[4], dt[5])
                          while True:
                              dt = self.data[self.counter_records][:6].astype(int)
                              datatime = datetime.datetime(dt[0], dt[1], dt[2], dt[3], dt[4], dt[5])
                              if datatime == self.datatime:
                                  dum.append(self.data[self.counter_records])
                                  self.counter_records += 1
                                  if self.counter_records == self.nrecords:
-                                     self.flagIsNewFile = True
                                      break
                                  continue
                              self.intervals.add((datatime-self.datatime).seconds)
                              break
                      elif self.ext == '.hdf5':
                          datatime = datetime.datetime.utcfromtimestamp(
                              self.times[self.counter_records])
                          dum = self.data['Table Layout'][self.data['Table Layout']['recno']==self.counter_records]
                          self.intervals.add((datatime-self.datatime).seconds)
                          if datatime.date()>self.datatime.date():
                              self.flagDiscontinuousBlock = 1
                          self.datatime = datatime
-                         self.counter_records += 1
-                         if self.counter_records == self.nrecords:
-                             self.flagIsNewFile = True
+                         self.counter_records += 1
                      self.buffer = numpy.array(dum)
                      return
                  def set_output(self):
                      '''
                      Storing data from buffer to dataOut object
                      '''
                      parameters = [None for __ in self.parameters]
                      for param, attr in list(self.oneDDict.items()):
                          x = self.parameters.index(param.lower())
                          setattr(self.dataOut, attr, self.buffer[0][x])
                      for param, value in list(self.twoDDict.items()):
                          dummy = numpy.zeros(self.ranges.shape) + numpy.nan
                          if self.ext == '.txt':
                              x = self.parameters.index(param.lower())
                              y = self.parameters.index(self.independentParam.lower())
                              ranges = self.buffer[:,y]
                              #if self.ranges.size == ranges.size:
                              #    continue
                              index = numpy.where(numpy.in1d(self.ranges, ranges))[0]
                              dummy[index] = self.buffer[:,x]
                          else:
                              ranges = self.buffer[self.independentParam.lower()]
                              index = numpy.where(numpy.in1d(self.ranges, ranges))[0]
                              dummy[index] = self.buffer[param.lower()]
                          if isinstance(value, str):
                              if value not in self.independentParam:
                                  setattr(self.dataOut, value, dummy.reshape(1,-1))
                          elif isinstance(value, list):
                              self.output[value[0]][value[1]] = dummy
                              parameters[value[1]] = param
                      for key, value in list(self.output.items()):
                          setattr(self.dataOut, key, numpy.array(value))
                      self.dataOut.parameters = [s for s in parameters if s]
                      self.dataOut.heightList = self.ranges
                      self.dataOut.utctime = (self.datatime - datetime.datetime(1970, 1, 1)).total_seconds()
                      self.dataOut.utctimeInit = self.dataOut.utctime
                      self.dataOut.paramInterval = min(self.intervals)
                      self.dataOut.useLocalTime = False
                      self.dataOut.flagNoData = False
                      self.dataOut.nrecords = self.nrecords
                      self.dataOut.flagDiscontinuousBlock = self.flagDiscontinuousBlock
                  def getData(self):
                      '''
                      Storing data from databuffer to dataOut object
                      '''
-                     if self.flagNoMoreFiles:
-                         self.dataOut.flagNoData = True
-                         raise schainpy.admin.SchainError('No file left to process')
-                         return 0
                      if not  self.readNextBlock():
                          self.dataOut.flagNoData = True
                          return 0
                      self.set_output()
                      return 1
+                 def run(self, **kwargs):
+                     if not(self.isConfig):
+                         self.setup(**kwargs)
+                         self.isConfig = True
+                     self.getData()
+                     return
              @MPDecorator
              class MADWriter(Operation):
-                 missing = -32767
+                 '''Writing module for Madrigal files
+             type: external
+             Inputs:
+                         path        path where files will be created
+                         oneDDict    json of one-dimensional parameters in record where keys
+                                     are Madrigal codes (integers or mnemonics) and values the corresponding
+                                     dataOut attribute e.g: {
+                                         'gdlatr': 'lat',
+                                         'gdlonr': 'lon',
+                                         'gdlat2':'lat',
+                                         'glon2':'lon'}
+                         ind2DList   list of independent spatial two-dimensional parameters e.g:
+                                     ['heigthList']
+                         twoDDict    json of two-dimensional parameters in record where keys
+                                     are Madrigal codes (integers or mnemonics) and values the corresponding
+                                     dataOut attribute if multidimensional array specify as tupple
+                                     ('attr', pos) e.g: {
+                                         'gdalt': 'heightList',
+                                         'vn1p2': ('data_output', 0),
+                                         'vn2p2': ('data_output', 1),
+                                         'vn3': ('data_output', 2),
+                                         'snl': ('data_SNR', 'db')
+                                         }
+                         metadata    json of madrigal metadata (kinst, kindat, catalog and header)
+                         format      hdf5, cedar
+                         blocks      number of blocks per file'''
+                 __attrs__ = ['path', 'oneDDict', 'ind2DList', 'twoDDict','metadata', 'format', 'blocks']
+                 missing = -32767
                  def __init__(self):
                      Operation.__init__(self)
                      self.dataOut = Parameters()
                      self.counter = 0
                      self.path = None
                      self.fp = None
-                 def run(self, dataOut, path, oneDDict, independentParam='[]', twoDDict='{}',
+                 def run(self, dataOut, path, oneDDict, ind2DList='[]', twoDDict='{}',
                          metadata='{}', format='cedar', **kwargs):
-                     '''
-                     Inputs:
-                         path - path where files will be created
-                         oneDDict - json of one-dimensional parameters in record where keys
-                         are Madrigal codes (integers or mnemonics) and values the corresponding
-                         dataOut attribute e.g: {
-                             'gdlatr': 'lat',
-                             'gdlonr': 'lon',
-                             'gdlat2':'lat',
-                             'glon2':'lon'}
-                         independentParam - list of independent spatial two-dimensional parameters e.g:
-                             ['heigthList']
-                         twoDDict - json of two-dimensional parameters in record where keys
-                         are Madrigal codes (integers or mnemonics) and values the corresponding
-                         dataOut attribute if multidimensional array specify as tupple
-                         ('attr', pos) e.g: {
-                             'gdalt': 'heightList',
-                             'vn1p2': ('data_output', 0),
-                             'vn2p2': ('data_output', 1),
-                             'vn3': ('data_output', 2),
-                             'snl': ('data_SNR', 'db')
+                             }
-                         metadata - json of madrigal metadata (kinst, kindat, catalog and header)
-                     '''
                      if not self.isConfig:
-                         self.setup(path, oneDDict, independentParam, twoDDict, metadata, format, **kwargs)
+                         self.setup(path, oneDDict, ind2DList, twoDDict, metadata, format, **kwargs)
                          self.isConfig = True
                      self.dataOut = dataOut
                      self.putData()
                      return 1
-                 def setup(self, path, oneDDict, independentParam, twoDDict, metadata, format, **kwargs):
+                 def setup(self, path, oneDDict, ind2DList, twoDDict, metadata, format, **kwargs):
                      '''
                      Configure Operation
                      '''
                      self.path = path
                      self.blocks = kwargs.get('blocks', None)
                      self.counter = 0
                      self.oneDDict = load_json(oneDDict)
                      self.twoDDict = load_json(twoDDict)
-                     self.independentParam = load_json(independentParam)
+                     self.ind2DList = load_json(ind2DList)
                      meta = load_json(metadata)
                      self.kinst = meta.get('kinst')
                      self.kindat = meta.get('kindat')
                      self.catalog = meta.get('catalog', DEF_CATALOG)
                      self.header = meta.get('header', DEF_HEADER)
                      if format == 'cedar':
                          self.ext = '.dat'
                          self.extra_args = {}
                      elif format == 'hdf5':
                          self.ext = '.hdf5'
-                         self.extra_args = {'independentParam': self.independentParam}
+                         self.extra_args = {'ind2DList': self.ind2DList}
                      self.keys = [k.lower() for k in self.twoDDict]
                      if 'range' in self.keys:
                          self.keys.remove('range')
                      if 'gdalt' in self.keys:
                          self.keys.remove('gdalt')
                  def setFile(self):
                      '''
                      Create new cedar file object
                      '''
                      self.mnemonic = MNEMONICS[self.kinst]   #TODO get mnemonic from madrigal
                      date = datetime.datetime.utcfromtimestamp(self.dataOut.utctime)
                      filename = '{}{}{}'.format(self.mnemonic,
                                                 date.strftime('%Y%m%d_%H%M%S'),
                                                 self.ext)
                      self.fullname = os.path.join(self.path, filename)
                      if os.path.isfile(self.fullname) :
                          log.warning(
                              'Destination file {} already exists, previous file deleted.'.format(
                                  self.fullname),
                              'MADWriter')
                          os.remove(self.fullname)
                      try:
                          log.success(
                              'Creating file: {}'.format(self.fullname),
                              'MADWriter')
+                         if not os.path.exists(self.path):
+                             os.makedirs(self.path)
                          self.fp = madrigal.cedar.MadrigalCedarFile(self.fullname, True)
                      except ValueError as e:
                          log.error(
                              'Impossible to create a cedar object with "madrigal.cedar.MadrigalCedarFile"',
                              'MADWriter')
                          return
                      return 1
                  def writeBlock(self):
                      '''
                      Add data records to cedar file taking data from oneDDict and twoDDict
                      attributes.
                      Allowed parameters in: parcodes.tab
                      '''
                      startTime = datetime.datetime.utcfromtimestamp(self.dataOut.utctime)
                      endTime = startTime + datetime.timedelta(seconds=self.dataOut.paramInterval)
                      heights = self.dataOut.heightList
                      if self.ext == '.dat':
                          for key, value in list(self.twoDDict.items()):
                              if isinstance(value, str):
                                  data = getattr(self.dataOut, value)
                                  invalid = numpy.isnan(data)
                                  data[invalid] = self.missing
                              elif isinstance(value, (tuple, list)):
                                  attr, key = value
                                  data = getattr(self.dataOut, attr)
                                  invalid = numpy.isnan(data)
                                  data[invalid] = self.missing
                      out = {}
                      for key, value in list(self.twoDDict.items()):
                          key = key.lower()
                          if isinstance(value, str):
                              if 'db' in value.lower():
                                  tmp = getattr(self.dataOut, value.replace('_db', ''))
                                  SNRavg = numpy.average(tmp, axis=0)
                                  tmp = 10*numpy.log10(SNRavg)
                              else:
                                  tmp = getattr(self.dataOut, value)
-                             out[key] = tmp.flatten()
+                             out[key] = tmp.flatten()[:len(heights)]
                          elif isinstance(value, (tuple, list)):
                              attr, x = value
-                             data = getattr(self.dataOut, attr)
-                             out[key] = data[int(x)]
+                             data = getattr(self.dataOut, attr)
+                             out[key] = data[int(x)][:len(heights)]
                      a = numpy.array([out[k] for k in self.keys])
                      nrows = numpy.array([numpy.isnan(a[:, x]).all() for x in range(len(heights))])
                      index = numpy.where(nrows == False)[0]
                      rec = madrigal.cedar.MadrigalDataRecord(
                          self.kinst,
                          self.kindat,
                          startTime.year,
                          startTime.month,
                          startTime.day,
                          startTime.hour,
                          startTime.minute,
                          startTime.second,
                          startTime.microsecond/10000,
                          endTime.year,
                          endTime.month,
                          endTime.day,
                          endTime.hour,
                          endTime.minute,
                          endTime.second,
                          endTime.microsecond/10000,
                          list(self.oneDDict.keys()),
                          list(self.twoDDict.keys()),
                          len(index),
                          **self.extra_args
                      )
                      # Setting 1d values
                      for key in self.oneDDict:
                          rec.set1D(key, getattr(self.dataOut, self.oneDDict[key]))
                      # Setting 2d values
                      nrec = 0
                      for n in index:
                          for key in out:
                              rec.set2D(key, nrec, out[key][n])
                          nrec += 1
                      self.fp.append(rec)
                      if self.ext == '.hdf5' and self.counter % 500 == 0 and self.counter > 0:
                          self.fp.dump()
                      if self.counter % 20 == 0 and self.counter > 0:
                          log.log(
                              'Writing {} records'.format(
                                  self.counter),
                              'MADWriter')
                  def setHeader(self):
                      '''
                      Create an add catalog and header to cedar file
                      '''
                      log.success('Closing file {}'.format(self.fullname), 'MADWriter')
                      if self.ext == '.dat':
                          self.fp.write()
                      else:
                          self.fp.dump()
                          self.fp.close()
                      header = madrigal.cedar.CatalogHeaderCreator(self.fullname)
                      header.createCatalog(**self.catalog)
                      header.createHeader(**self.header)
                      header.write()
                  def putData(self):
                      if self.dataOut.flagNoData:
                          return 0
                      if self.dataOut.flagDiscontinuousBlock or self.counter == self.blocks:
                          if self.counter > 0:
                              self.setHeader()
                          self.counter = 0
                      if self.counter == 0:
                          self.setFile()
                      self.writeBlock()
                      self.counter += 1
                  def close(self):
                      if self.counter > 0:
                          self.setHeader()
  No newline at end of file

schainpy/model/io/jroIO_param.py +123 -232

              import numpy
              import time
              import os
              import h5py
              import re
              import datetime
              import schainpy.admin
              from schainpy.model.data.jrodata import *
              from schainpy.model.proc.jroproc_base import ProcessingUnit, Operation, MPDecorator
              from schainpy.model.io.jroIO_base import *
              from schainpy.utils import log
              @MPDecorator
              class ParamReader(JRODataReader,ProcessingUnit):
                  '''
                  Reads HDF5 format files
                  path
                  startDate
                  endDate
                  startTime
                  endTime
                  '''
                  ext = ".hdf5"
                  optchar = "D"
                  timezone = None
                  startTime = None
                  endTime = None
                  fileIndex = None
                  utcList = None      #To select data in the utctime list
                  blockList = None    #List to blocks to be read from the file
                  blocksPerFile = None    #Number of blocks to be read
                  blockIndex = None
                  path = None
                  #List of Files
                  filenameList = None
                  datetimeList = None
                  #Hdf5 File
                  listMetaname = None
                  listMeta = None
                  listDataname = None
                  listData = None
                  listShapes = None
                  fp = None
                  #dataOut reconstruction
                  dataOut = None
                  def __init__(self):#, **kwargs):
                      ProcessingUnit.__init__(self) #, **kwargs)
                      self.dataOut = Parameters()
                      return
                  def setup(self, **kwargs):
                      path = kwargs['path']
                      startDate = kwargs['startDate']
                      endDate = kwargs['endDate']
                      startTime = kwargs['startTime']
                      endTime = kwargs['endTime']
                      walk = kwargs['walk']
                      if 'ext' in kwargs:
                          ext = kwargs['ext']
                      else:
                          ext = '.hdf5'
                      if 'timezone' in kwargs:
                          self.timezone = kwargs['timezone']
                      else:
                          self.timezone = 'lt'
                      print("[Reading] Searching files in offline mode ...")
                      pathList, filenameList = self.searchFilesOffLine(path, startDate=startDate, endDate=endDate,
                                                                             startTime=startTime, endTime=endTime,
                                                                             ext=ext, walk=walk)
                      if not(filenameList):
                          print("There is no files into the folder: %s"%(path))
                          sys.exit(-1)
                      self.fileIndex = -1
                      self.startTime = startTime
                      self.endTime = endTime
                      self.__readMetadata()
                      self.__setNextFileOffline()
                      return
                  def searchFilesOffLine(self,
                                          path,
                                          startDate=None,
                                          endDate=None,
                                          startTime=datetime.time(0,0,0),
                                          endTime=datetime.time(23,59,59),
                                          ext='.hdf5',
                                          walk=True):
                      expLabel = ''
                      self.filenameList = []
                      self.datetimeList = []
                      pathList = []
                      JRODataObj = JRODataReader()
                      dateList, pathList = JRODataObj.findDatafiles(path, startDate, endDate, expLabel, ext, walk, include_path=True)
                      if dateList == []:
                          print("[Reading] No *%s files in %s from %s to %s)"%(ext, path,
                                                                      datetime.datetime.combine(startDate,startTime).ctime(),
                                                                      datetime.datetime.combine(endDate,endTime).ctime()))
                          return None, None
                      if len(dateList) > 1:
                          print("[Reading] %d days were found in date range: %s - %s" %(len(dateList), startDate, endDate))
                      else:
                          print("[Reading] data was found for the date %s" %(dateList[0]))
                      filenameList = []
                      datetimeList = []
                      #----------------------------------------------------------------------------------
                      for thisPath in pathList:
                          fileList = glob.glob1(thisPath, "*%s" %ext)
                          fileList.sort()
                          for file in fileList:
                              filename = os.path.join(thisPath,file)
                              if not isFileInDateRange(filename, startDate, endDate):
                                  continue
                              thisDatetime = self.__isFileInTimeRange(filename, startDate, endDate, startTime, endTime)
                              if not(thisDatetime):
                                  continue
                              filenameList.append(filename)
                              datetimeList.append(thisDatetime)
                      if not(filenameList):
                          print("[Reading] Any file was found int time range %s - %s" %(datetime.datetime.combine(startDate,startTime).ctime(), datetime.datetime.combine(endDate,endTime).ctime()))
                          return None, None
                      print("[Reading] %d file(s) was(were) found in time range: %s - %s" %(len(filenameList), startTime, endTime))
                      print()
                      self.filenameList = filenameList
                      self.datetimeList = datetimeList
                      return pathList, filenameList
                  def __isFileInTimeRange(self,filename, startDate, endDate, startTime, endTime):
                      """
                      Retorna 1 si el archivo de datos se encuentra dentro del rango de horas especificado.
                      Inputs:
                          filename            :    nombre completo del archivo de datos en formato Jicamarca (.r)
                          startDate          :    fecha inicial del rango seleccionado en formato datetime.date
                          endDate            :    fecha final del rango seleccionado en formato datetime.date
                          startTime          :    tiempo inicial del rango seleccionado en formato datetime.time
                          endTime            :    tiempo final del rango seleccionado en formato datetime.time
                      Return:
                          Boolean    :    Retorna True si el archivo de datos contiene datos en el rango de
                                          fecha especificado, de lo contrario retorna False.
                      Excepciones:
                          Si el archivo no existe o no puede ser abierto
                          Si la cabecera no puede ser leida.
                      """
                      try:
                          fp = h5py.File(filename,'r')
                          grp1 = fp['Data']
                      except IOError:
                          traceback.print_exc()
                          raise IOError("The file %s can't be opened" %(filename))
                      #In case has utctime attribute
                      grp2 = grp1['utctime']
               #         thisUtcTime = grp2.value[0] - 5*3600 #To convert to local time
                      thisUtcTime = grp2.value[0]
                      fp.close()
                      if self.timezone == 'lt':
                          thisUtcTime -= 5*3600
                      thisDatetime = datetime.datetime.fromtimestamp(thisUtcTime[0] + 5*3600)
                      thisDate = thisDatetime.date()
                      thisTime = thisDatetime.time()
                      startUtcTime = (datetime.datetime.combine(thisDate,startTime)- datetime.datetime(1970, 1, 1)).total_seconds()
                      endUtcTime = (datetime.datetime.combine(thisDate,endTime)- datetime.datetime(1970, 1, 1)).total_seconds()
                      #General case
                      #           o>>>>>>>>>>>>>><<<<<<<<<<<<<<o
                      #-----------o----------------------------o-----------
                      #       startTime                     endTime
                      if endTime >= startTime:
                          thisUtcLog = numpy.logical_and(thisUtcTime > startUtcTime, thisUtcTime < endUtcTime)
                          if numpy.any(thisUtcLog):   #If there is one block between the hours mentioned
                              return thisDatetime
                          return None
                      #If endTime < startTime then endTime belongs to the next day
                      #<<<<<<<<<<<o                            o>>>>>>>>>>>
                      #-----------o----------------------------o-----------
                      #        endTime                    startTime
                      if (thisDate == startDate) and numpy.all(thisUtcTime < startUtcTime):
                          return None
                      if (thisDate == endDate) and numpy.all(thisUtcTime > endUtcTime):
                          return None
                      if numpy.all(thisUtcTime < startUtcTime) and numpy.all(thisUtcTime > endUtcTime):
                          return None
                      return thisDatetime
                  def __setNextFileOffline(self):
                      self.fileIndex += 1
                      idFile = self.fileIndex
                      if not(idFile < len(self.filenameList)):
                          raise schainpy.admin.SchainError("No more Files")
                          return 0
                      filename = self.filenameList[idFile]
                      filePointer = h5py.File(filename,'r')
                      self.filename = filename
                      self.fp = filePointer
                      print("Setting the file: %s"%self.filename)
                      self.__setBlockList()
                      self.__readData()
                      self.blockIndex = 0
                      return 1
                  def __setBlockList(self):
                      '''
                      Selects the data within the times defined
                      self.fp
                      self.startTime
                      self.endTime
                      self.blockList
                      self.blocksPerFile
                      '''
                      fp = self.fp
                      startTime = self.startTime
                      endTime = self.endTime
                      grp = fp['Data']
                      thisUtcTime = grp['utctime'].value.astype(numpy.float)[0]
                      #ERROOOOR
                      if self.timezone == 'lt':
                          thisUtcTime -= 5*3600
                      thisDatetime = datetime.datetime.fromtimestamp(thisUtcTime[0] + 5*3600)
                      thisDate = thisDatetime.date()
                      thisTime = thisDatetime.time()
                      startUtcTime = (datetime.datetime.combine(thisDate,startTime) - datetime.datetime(1970, 1, 1)).total_seconds()
                      endUtcTime = (datetime.datetime.combine(thisDate,endTime) - datetime.datetime(1970, 1, 1)).total_seconds()
                      ind = numpy.where(numpy.logical_and(thisUtcTime >= startUtcTime, thisUtcTime < endUtcTime))[0]
                      self.blockList = ind
                      self.blocksPerFile = len(ind)
                      return
                  def __readMetadata(self):
                      '''
                      Reads Metadata
                      self.pathMeta
                      self.listShapes
                      self.listMetaname
                      self.listMeta
                      '''
                      filename = self.filenameList[0]
                      fp = h5py.File(filename,'r')
                      gp = fp['Metadata']
                      listMetaname = []
                      listMetadata = []
                      for item in list(gp.items()):
                          name = item[0]
                          if name=='array dimensions':
                              table = gp[name][:]
                              listShapes = {}
                              for shapes in table:
                                  listShapes[shapes[0]] = numpy.array([shapes[1],shapes[2],shapes[3],shapes[4],shapes[5]])
                          else:
                              data = gp[name].value
                              listMetaname.append(name)
                              listMetadata.append(data)
                      self.listShapes = listShapes
                      self.listMetaname = listMetaname
                      self.listMeta = listMetadata
                      fp.close()
                      return
                  def __readData(self):
                      grp = self.fp['Data']
                      listdataname = []
                      listdata = []
                      for item in list(grp.items()):
                          name = item[0]
                          listdataname.append(name)
                          array = self.__setDataArray(grp[name],self.listShapes[name])
                          listdata.append(array)
                      self.listDataname = listdataname
                      self.listData = listdata
                      return
                  def __setDataArray(self, dataset, shapes):
                      nDims = shapes[0]
                      nDim2 = shapes[1]      #Dimension 0
                      nDim1 = shapes[2]      #Dimension 1, number of Points or Parameters
                      nDim0 = shapes[3]      #Dimension 2, number of samples or ranges
                      mode = shapes[4]        #Mode of storing
                      blockList = self.blockList
                      blocksPerFile = self.blocksPerFile
                      #Depending on what mode the data was stored
                      if mode == 0:       #Divided in channels
                          arrayData = dataset.value.astype(numpy.float)[0][blockList]
                      if mode == 1:     #Divided in parameter
                          strds = 'table'
                          nDatas = nDim1
                          newShapes = (blocksPerFile,nDim2,nDim0)
                      elif mode==2:       #Concatenated in a table
                          strds = 'table0'
                          arrayData = dataset[strds].value
                          #Selecting part of the dataset
                          utctime = arrayData[:,0]
                          u, indices = numpy.unique(utctime, return_index=True)
                          if blockList.size != indices.size:
                              indMin = indices[blockList[0]]
                              if blockList[1] + 1 >= indices.size:
                                  arrayData = arrayData[indMin:,:]
                              else:
                                  indMax = indices[blockList[1] + 1]
                                  arrayData = arrayData[indMin:indMax,:]
                          return arrayData
                      #    One dimension
                      if nDims == 0:
                          arrayData = dataset.value.astype(numpy.float)[0][blockList]
                      #    Two dimensions
                      elif nDims == 2:
                          arrayData = numpy.zeros((blocksPerFile,nDim1,nDim0))
                          newShapes = (blocksPerFile,nDim0)
                          nDatas = nDim1
                          for i in range(nDatas):
                              data = dataset[strds + str(i)].value
                              arrayData[:,i,:] = data[blockList,:]
                      #    Three dimensions
                      else:
                          arrayData = numpy.zeros((blocksPerFile,nDim2,nDim1,nDim0))
                          for i in range(nDatas):
                              data = dataset[strds + str(i)].value
                              for b in range(blockList.size):
                                  arrayData[b,:,i,:] = data[:,:,blockList[b]]
                      return arrayData
                  def __setDataOut(self):
                      listMeta = self.listMeta
                      listMetaname = self.listMetaname
                      listDataname = self.listDataname
                      listData = self.listData
                      listShapes = self.listShapes
                      blockIndex = self.blockIndex
               #         blockList = self.blockList
                      for i in range(len(listMeta)):
                          setattr(self.dataOut,listMetaname[i],listMeta[i])
                      for j in range(len(listData)):
                          nShapes = listShapes[listDataname[j]][0]
                          mode = listShapes[listDataname[j]][4]
                          if nShapes == 1:
                              setattr(self.dataOut,listDataname[j],listData[j][blockIndex])
                          elif nShapes > 1:
                              setattr(self.dataOut,listDataname[j],listData[j][blockIndex,:])
                          elif mode==0:
                              setattr(self.dataOut,listDataname[j],listData[j][blockIndex])
                          #Mode Meteors
                          elif mode ==2:
                              selectedData = self.__selectDataMode2(listData[j], blockIndex)
                              setattr(self.dataOut, listDataname[j], selectedData)
                      return
                  def __selectDataMode2(self, data, blockIndex):
                      utctime = data[:,0]
                      aux, indices = numpy.unique(utctime, return_inverse=True)
                      selInd = numpy.where(indices == blockIndex)[0]
                      selData = data[selInd,:]
                      return selData
                  def getData(self):
                      if self.blockIndex==self.blocksPerFile:
                           if not( self.__setNextFileOffline() ):
                              self.dataOut.flagNoData = True
                              return 0
                      self.__setDataOut()
                      self.dataOut.flagNoData = False
                      self.blockIndex += 1
                      return
                  def run(self, **kwargs):
                      if not(self.isConfig):
                          self.setup(**kwargs)
                          self.isConfig = True
                      self.getData()
                      return
              @MPDecorator
              class ParamWriter(Operation):
                  '''
                  HDF5 Writer, stores parameters data in HDF5 format files
                  path:             path where the files will be stored
                  blocksPerFile:    number of blocks that will be saved in per HDF5 format file
                  mode:             selects the data stacking mode: '0' channels, '1' parameters, '3' table (for meteors)
                  metadataList:     list of attributes that will be stored as metadata
                  dataList:         list of attributes that will be stores as data
                  '''
                  ext = ".hdf5"
                  optchar = "D"
                  metaoptchar = "M"
                  metaFile = None
                  filename = None
                  path = None
                  setFile = None
                  fp = None
                  grp = None
                  ds = None
                  firsttime = True
                  #Configurations
                  blocksPerFile = None
                  blockIndex = None
                  dataOut = None
                  #Data Arrays
                  dataList = None
                  metadataList = None
                  dsList = None   #List of dictionaries with dataset properties
                  tableDim = None
                  dtype = [('arrayName', 'S20'),('nDimensions', 'i'), ('dim2', 'i'), ('dim1', 'i'),('dim0', 'i'),('mode', 'b')]
                  currentDay = None
                  lastTime = None
                  setType = None
                  def __init__(self):
                      Operation.__init__(self)
                      return
                  def setup(self, dataOut, path=None, blocksPerFile=10, metadataList=None, dataList=None, mode=None, setType=None):
                      self.path = path
                      self.blocksPerFile = blocksPerFile
                      self.metadataList = metadataList
                      self.dataList = dataList
                      self.dataOut = dataOut
                      self.mode = mode
                      if self.mode is not None:
                          self.mode = numpy.zeros(len(self.dataList)) + mode
                      else:
                          self.mode = numpy.ones(len(self.dataList))
                      self.setType = setType
                      arrayDim = numpy.zeros((len(self.dataList),5))
                      #Table dimensions
                      dtype0 = self.dtype
                      tableList = []
                      #Dictionary and list of tables
                      dsList = []
                      for i in range(len(self.dataList)):
                          dsDict = {}
                          dataAux = getattr(self.dataOut, self.dataList[i])
                          dsDict['variable'] = self.dataList[i]
                          #---------------------    Conditionals    ------------------------
                          #There is no data
                          if dataAux is None:
                              return 0
                          if isinstance(dataAux, (int, float, numpy.integer, numpy.float)):
                              dsDict['mode'] = 0
                              dsDict['nDim'] = 0
                              arrayDim[i,0] = 0
                              dsList.append(dsDict)
                          #Mode 2: meteors
                          elif self.mode[i] == 2:
                              dsDict['dsName'] = 'table0'
                              dsDict['mode'] = 2      # Mode meteors
                              dsDict['shape'] = dataAux.shape[-1]
                              dsDict['nDim'] = 0
                              dsDict['dsNumber'] = 1
                              arrayDim[i,3] = dataAux.shape[-1]
                              arrayDim[i,4] = self.mode[i]         #Mode the data was stored
                              dsList.append(dsDict)
                          #Mode 1
                          else:
                              arrayDim0 = dataAux.shape       #Data dimensions
                              arrayDim[i,0] = len(arrayDim0)  #Number of array dimensions
                              arrayDim[i,4] = self.mode[i]         #Mode the data was stored
                              strtable = 'table'
                              dsDict['mode'] = 1      # Mode parameters
                              # Three-dimension arrays
                              if len(arrayDim0) == 3:
                                  arrayDim[i,1:-1] = numpy.array(arrayDim0)
                                  nTables = int(arrayDim[i,2])
                                  dsDict['dsNumber'] = nTables
                                  dsDict['shape'] = arrayDim[i,2:4]
                                  dsDict['nDim'] = 3
                                  for j in range(nTables):
                                      dsDict = dsDict.copy()
                                      dsDict['dsName'] = strtable + str(j)
                                      dsList.append(dsDict)
                              # Two-dimension arrays
                              elif len(arrayDim0) == 2:
                                  arrayDim[i,2:-1] = numpy.array(arrayDim0)
                                  nTables = int(arrayDim[i,2])
                                  dsDict['dsNumber'] = nTables
                                  dsDict['shape'] = arrayDim[i,3]
                                  dsDict['nDim'] = 2
                                  for j in range(nTables):
                                      dsDict = dsDict.copy()
                                      dsDict['dsName'] = strtable + str(j)
                                      dsList.append(dsDict)
                              # One-dimension arrays
                              elif len(arrayDim0) == 1:
                                  arrayDim[i,3] = arrayDim0[0]
                                  dsDict['shape'] = arrayDim0[0]
                                  dsDict['dsNumber'] = 1
                                  dsDict['dsName'] = strtable + str(0)
                                  dsDict['nDim'] = 1
                                  dsList.append(dsDict)
                          table = numpy.array((self.dataList[i],) + tuple(arrayDim[i,:]),dtype = dtype0)
                          tableList.append(table)
                      self.dsList = dsList
                      self.tableDim = numpy.array(tableList, dtype = dtype0)
                      self.blockIndex = 0
                      timeTuple = time.localtime(dataOut.utctime)
                      self.currentDay = timeTuple.tm_yday
                  def putMetadata(self):
                      fp = self.createMetadataFile()
                      self.writeMetadata(fp)
                      fp.close()
                      return
                  def createMetadataFile(self):
                      ext = self.ext
                      path = self.path
                      setFile = self.setFile
                      timeTuple = time.localtime(self.dataOut.utctime)
                      subfolder = ''
                      fullpath = os.path.join( path, subfolder )
                      if not( os.path.exists(fullpath) ):
                          os.mkdir(fullpath)
                          setFile = -1 #inicializo mi contador de seteo
                      subfolder = 'd%4.4d%3.3d' % (timeTuple.tm_year,timeTuple.tm_yday)
                      fullpath = os.path.join( path, subfolder )
                      if not( os.path.exists(fullpath) ):
                          os.mkdir(fullpath)
                          setFile = -1 #inicializo mi contador de seteo
                      else:
                          filesList = os.listdir( fullpath )
                          filesList = sorted( filesList, key=str.lower )
                          if len( filesList ) > 0:
                              filesList = [k for k in filesList if k.startswith(self.metaoptchar)]
                              filen = filesList[-1]
                              # el filename debera tener el siguiente formato
                              # 0 1234 567 89A BCDE (hex)
                              # x YYYY DDD SSS .ext
                              if isNumber( filen[8:11] ):
                                  setFile = int( filen[8:11] ) #inicializo mi contador de seteo al seteo del ultimo file
                              else:
                                  setFile = -1
                          else:
                              setFile = -1 #inicializo mi contador de seteo
                      if self.setType is None:
                          setFile += 1
                          file = '%s%4.4d%3.3d%03d%s' % (self.metaoptchar,
                                                         timeTuple.tm_year,
                                                         timeTuple.tm_yday,
                                                         setFile,
                                                         ext )
                      else:
                          setFile = timeTuple.tm_hour*60+timeTuple.tm_min
                          file = '%s%4.4d%3.3d%04d%s' % (self.metaoptchar,
                                                         timeTuple.tm_year,
                                                         timeTuple.tm_yday,
                                                         setFile,
                                                         ext )
                      filename = os.path.join( path, subfolder, file )
                      self.metaFile = file
                      #Setting HDF5 File
                      fp = h5py.File(filename,'w')
                      return fp
                  def writeMetadata(self, fp):
                      grp = fp.create_group("Metadata")
                      grp.create_dataset('array dimensions', data = self.tableDim, dtype = self.dtype)
                      for i in range(len(self.metadataList)):
                          grp.create_dataset(self.metadataList[i], data=getattr(self.dataOut, self.metadataList[i]))
                      return
                  def timeFlag(self):
                      currentTime = self.dataOut.utctime
                      if self.lastTime is None:
                          self.lastTime = currentTime
                      #Day
                      timeTuple = time.localtime(currentTime)
                      dataDay = timeTuple.tm_yday
                      #Time
                      timeDiff = currentTime - self.lastTime
                      #Si el dia es diferente o si la diferencia entre un dato y otro supera la hora
                      if dataDay != self.currentDay:
                          self.currentDay = dataDay
                          return True
                      elif timeDiff > 3*60*60:
                          self.lastTime = currentTime
                          return True
                      else:
                          self.lastTime = currentTime
                          return False
                  def setNextFile(self):
                      ext = self.ext
                      path = self.path
                      setFile = self.setFile
                      mode = self.mode
                      timeTuple = time.localtime(self.dataOut.utctime)
                      subfolder = 'd%4.4d%3.3d' % (timeTuple.tm_year,timeTuple.tm_yday)
                      fullpath = os.path.join( path, subfolder )
                      if os.path.exists(fullpath):
                          filesList = os.listdir( fullpath )
                          filesList = [k for k in filesList if 'M' in k]
                          if len( filesList ) > 0:
                              filesList = sorted( filesList, key=str.lower )
                              filen = filesList[-1]
                              # el filename debera tener el siguiente formato
                              # 0 1234 567 89A BCDE (hex)
                              # x YYYY DDD SSS .ext
                              if isNumber( filen[8:11] ):
                                  setFile = int( filen[8:11] ) #inicializo mi contador de seteo al seteo del ultimo file
                              else:
                                  setFile = -1
                          else:
                              setFile = -1 #inicializo mi contador de seteo
                      else:
                          os.makedirs(fullpath)
                          setFile = -1 #inicializo mi contador de seteo
                      if self.setType is None:
                          setFile += 1
                          file = '%s%4.4d%3.3d%03d%s' % (self.optchar,
                                                         timeTuple.tm_year,
                                                         timeTuple.tm_yday,
                                                         setFile,
                                                         ext )
                      else:
                          setFile = timeTuple.tm_hour*60+timeTuple.tm_min
                          file = '%s%4.4d%3.3d%04d%s' % (self.optchar,
                                                         timeTuple.tm_year,
                                                         timeTuple.tm_yday,
                                                         setFile,
                                                         ext )
                      filename = os.path.join( path, subfolder, file )
                      #Setting HDF5 File
                      fp = h5py.File(filename,'w')
                      #write metadata
                      self.writeMetadata(fp)
                      #Write data
                      grp = fp.create_group("Data")
                      ds = []
                      data = []
                      dsList = self.dsList
                      i = 0
                      while i < len(dsList):
                          dsInfo = dsList[i]
                          #One-dimension data
                          if dsInfo['mode'] == 0:
                              ds0 = grp.create_dataset(dsInfo['variable'], (1,1), maxshape=(1,self.blocksPerFile) , chunks = True, dtype=numpy.float64)
                              ds.append(ds0)
                              data.append([])
                              i += 1
                              continue
                          elif dsInfo['mode'] == 2:
                              grp0 = grp.create_group(dsInfo['variable'])
                              ds0 = grp0.create_dataset(dsInfo['dsName'], (1,dsInfo['shape']), data = numpy.zeros((1,dsInfo['shape'])) , maxshape=(None,dsInfo['shape']), chunks=True)
                              ds.append(ds0)
                              data.append([])
                              i += 1
                              continue
                          elif dsInfo['mode'] == 1:
                              grp0 = grp.create_group(dsInfo['variable'])
                              for j in range(dsInfo['dsNumber']):
                                  dsInfo = dsList[i]
                                  tableName = dsInfo['dsName']
                                  if dsInfo['nDim'] == 3:
                                      shape = dsInfo['shape'].astype(int)
                                      ds0 = grp0.create_dataset(tableName, (shape[0],shape[1],1) , data = numpy.zeros((shape[0],shape[1],1)), maxshape = (None,shape[1],None), chunks=True)
                                  else:
                                      shape = int(dsInfo['shape'])
                                      ds0 = grp0.create_dataset(tableName, (1,shape), data = numpy.zeros((1,shape)) , maxshape=(None,shape), chunks=True)
                                  ds.append(ds0)
                                  data.append([])
                                  i += 1
                      fp.flush()
                      fp.close()
                      log.log('creating file: {}'.format(filename), 'Writing')
                      self.filename = filename
                      self.ds = ds
                      self.data = data
                      self.firsttime = True
                      self.blockIndex = 0
                      return
                  def putData(self):
                      if self.blockIndex == self.blocksPerFile or self.timeFlag():
                          self.setNextFile()
                      self.readBlock()
                      self.setBlock()     #Prepare data to be written
                      self.writeBlock()   #Write data
                      return
                  def readBlock(self):
                      '''
                      data Array configured
                      self.data
                      '''
                      dsList = self.dsList
                      ds = self.ds
                              #Setting HDF5 File
                      fp = h5py.File(self.filename,'r+')
                      grp = fp["Data"]
                      ind = 0
                      while ind < len(dsList):
                          dsInfo = dsList[ind]
                          if dsInfo['mode'] == 0:
                              ds0 = grp[dsInfo['variable']]
                              ds[ind] = ds0
                              ind += 1
                          else:
                              grp0 = grp[dsInfo['variable']]
                              for j in range(dsInfo['dsNumber']):
                                  dsInfo = dsList[ind]
                                  ds0 = grp0[dsInfo['dsName']]
                                  ds[ind] = ds0
                                  ind += 1
                      self.fp = fp
                      self.grp = grp
                      self.ds = ds
                      return
                  def setBlock(self):
                      '''
                      data Array configured
                      self.data
                      '''
                      #Creating Arrays
                      dsList = self.dsList
                      data = self.data
                      ind = 0
                      while ind < len(dsList):
                          dsInfo = dsList[ind]
                          dataAux = getattr(self.dataOut, dsInfo['variable'])
                          mode = dsInfo['mode']
                          nDim = dsInfo['nDim']
                          if mode == 0 or mode == 2 or nDim == 1:
                              data[ind] = dataAux
                              ind += 1
               #             elif nDim == 1:
               #                 data[ind] = numpy.reshape(dataAux,(numpy.size(dataAux),1))
               #                 ind += 1
                          elif nDim == 2:
                              for j in range(dsInfo['dsNumber']):
                                  data[ind] = dataAux[j,:]
                                  ind += 1
                          elif nDim == 3:
                              for j in range(dsInfo['dsNumber']):
                                  data[ind] = dataAux[:,j,:]
                                  ind += 1
                      self.data = data
                      return
                  def writeBlock(self):
                      '''
                      Saves the block in the HDF5 file
                      '''
                      dsList = self.dsList
                      for i in range(len(self.ds)):
                          dsInfo = dsList[i]
                          nDim = dsInfo['nDim']
                          mode = dsInfo['mode']
                          #    First time
                          if self.firsttime:
                              if type(self.data[i]) == numpy.ndarray:
                                  if nDim == 3:
                                      self.data[i] = self.data[i].reshape((self.data[i].shape[0],self.data[i].shape[1],1))
                                      self.ds[i].resize(self.data[i].shape)
                                  if mode == 2:
                                      self.ds[i].resize(self.data[i].shape)
                              self.ds[i][:] = self.data[i]
                          else:
                          #    From second time
                              #    Meteors!
                              if mode == 2:
                                  dataShape = self.data[i].shape
                                  dsShape = self.ds[i].shape
                                  self.ds[i].resize((self.ds[i].shape[0] + dataShape[0],self.ds[i].shape[1]))
                                  self.ds[i][dsShape[0]:,:] = self.data[i]
                              #    No dimension
                              elif mode == 0:
                                  self.ds[i].resize((self.ds[i].shape[0], self.ds[i].shape[1] + 1))
                                  self.ds[i][0,-1] = self.data[i]
                              #    One dimension
                              elif nDim == 1:
                                  self.ds[i].resize((self.ds[i].shape[0] + 1, self.ds[i].shape[1]))
                                  self.ds[i][-1,:] = self.data[i]
                              #    Two dimension
                              elif nDim == 2:
                                  self.ds[i].resize((self.ds[i].shape[0] + 1,self.ds[i].shape[1]))
                                  self.ds[i][self.blockIndex,:] = self.data[i]
                              #    Three dimensions
                              elif nDim == 3:
                                  self.ds[i].resize((self.ds[i].shape[0],self.ds[i].shape[1],self.ds[i].shape[2]+1))
                                  self.ds[i][:,:,-1] = self.data[i]
                      self.firsttime = False
                      self.blockIndex += 1
                      #Close to save changes
                      self.fp.flush()
                      self.fp.close()
                      return
                  def run(self, dataOut, path, blocksPerFile=10, metadataList=None, dataList=None, mode=None, setType=None):
                      self.dataOut = dataOut
                      if not(self.isConfig):
                          self.setup(dataOut, path=path, blocksPerFile=blocksPerFile,
                                     metadataList=metadataList, dataList=dataList, mode=mode,
                                     setType=setType)
                          self.isConfig = True
                          self.setNextFile()
                      self.putData()
                      return
              @MPDecorator
-             class ParameterReader(JRODataReader,ProcessingUnit):
+             class ParameterReader(Reader, ProcessingUnit):
                  '''
                  Reads HDF5 format files
                  '''
-                 ext = ".hdf5"
-                 optchar = "D"
-                 timezone = None
-                 startTime = None
-                 endTime = None
-                 fileIndex = None
-                 blockList = None    #List to blocks to be read from the file
-                 blocksPerFile = None    #Number of blocks to be read
-                 blockIndex = None
-                 path = None
-                 #List of Files
-                 filenameList = None
-                 datetimeList = None
-                 #Hdf5 File
-                 listMetaname = None
-                 listMeta = None
-                 listDataname = None
-                 listData = None
-                 listShapes = None
-                 fp = None
-                 #dataOut reconstruction
-                 dataOut = None
                  def __init__(self):
                      ProcessingUnit.__init__(self)
                      self.dataOut = Parameters()
-                     return
+                     self.ext = ".hdf5"
+                     self.optchar = "D"
+                     self.timezone = "lt"
+                     self.listMetaname = []
+                     self.listMeta = []
+                     self.listDataname = []
+                     self.listData = []
+                     self.listShapes = []
+                     self.open_file = h5py.File
+                     self.open_mode = 'r'
+                     self.metadata = False
+                     self.filefmt = "*%Y%j***"
+                     self.folderfmt = "*%Y%j"
                  def setup(self, **kwargs):
-                     path = kwargs['path']
-                     startDate = kwargs['startDate']
-                     endDate = kwargs['endDate']
-                     startTime = kwargs['startTime']
-                     endTime = kwargs['endTime']
-                     walk = kwargs['walk']
-                     if 'ext' in kwargs:
-                         ext = kwargs['ext']
-                     else:
-                         ext = '.hdf5'
-                     if 'timezone' in kwargs:
-                         self.timezone = kwargs['timezone']
-                     else:
-                         self.timezone = 'lt'
-                     print("[Reading] Searching files in offline mode ...")
-                     pathList, filenameList = self.searchFilesOffLine(path, startDate=startDate, endDate=endDate,
-                                                                            startTime=startTime, endTime=endTime,
-                                                                            ext=ext, walk=walk)
+                     self.set_kwargs(**kwargs)
+                     if not self.ext.startswith('.'):
+                         self.ext = '.{}'.format(self.ext)
-                     if not(filenameList):
-                         print("There is no files into the folder: %s"%(path))
-                         sys.exit(-1)
-                     self.fileIndex = -1
-                     self.startTime = startTime
-                     self.endTime = endTime
-                     self.__readMetadata()
-                     self.__setNextFileOffline()
-                     return
+                     if self.online:
+                         log.log("Searching files in online mode...", self.name)
-                 def searchFilesOffLine(self, path, startDate=None, endDate=None, startTime=datetime.time(0,0,0), endTime=datetime.time(23,59,59), ext='.hdf5', walk=True):
+                         for nTries in range(self.nTries):
+                             fullpath = self.searchFilesOnLine(self.path, self.startDate,
+                                 self.endDate, self.expLabel, self.ext, self.walk,
+                                 self.filefmt, self.folderfmt)
-                     expLabel = ''
-                     self.filenameList = []
-                     self.datetimeList = []
-                     pathList = []
-                     dateList, pathList = self.findDatafiles(path, startDate, endDate, expLabel, ext, walk, include_path=True)
-                     if dateList == []:
-                         print("[Reading] No *%s files in %s from %s to %s)"%(ext, path,
-                                                                     datetime.datetime.combine(startDate,startTime).ctime(),
-                                                                     datetime.datetime.combine(endDate,endTime).ctime()))
-                         return None, None
-                     if len(dateList) > 1:
-                         print("[Reading] %d days were found in date range: %s - %s" %(len(dateList), startDate, endDate))
+                             try:
+                                 fullpath = next(fullpath)
+                             except:
+                                 fullpath = None
+                             if fullpath:
+                                 break
+                             log.warning(
+                                 'Waiting {} sec for a valid file in {}: try {} ...'.format(
+                                     self.delay, self.path, nTries + 1),
+                                 self.name)
+                             time.sleep(self.delay)
+                         if not(fullpath):
+                             raise schainpy.admin.SchainError(
+                                 'There isn\'t any valid file in {}'.format(self.path))
+                         pathname, filename = os.path.split(fullpath)
+                         self.year = int(filename[1:5])
+                         self.doy = int(filename[5:8])
+                         self.set = int(filename[8:11]) - 1
                      else:
-                         print("[Reading] data was found for the date %s" %(dateList[0]))
-                     filenameList = []
-                     datetimeList = []
-                     for thisPath in pathList:
-                         fileList = glob.glob1(thisPath, "*%s" %ext)
-                         fileList.sort()
-                         for file in fileList:
-                             filename = os.path.join(thisPath,file)
-                             if not isFileInDateRange(filename, startDate, endDate):
-                                 continue
-                             thisDatetime = self.__isFileInTimeRange(filename, startDate, endDate, startTime, endTime)
-                             if not(thisDatetime):
-                                 continue
-                             filenameList.append(filename)
-                             datetimeList.append(thisDatetime)
-                     if not(filenameList):
-                         print("[Reading] Any file was found int time range %s - %s" %(datetime.datetime.combine(startDate,startTime).ctime(), datetime.datetime.combine(endDate,endTime).ctime()))
-                         return None, None
-                     print("[Reading] %d file(s) was(were) found in time range: %s - %s" %(len(filenameList), startTime, endTime))
-                     print()
-                     self.filenameList = filenameList
-                     self.datetimeList = datetimeList
-                     return pathList, filenameList
-                 def __isFileInTimeRange(self,filename, startDate, endDate, startTime, endTime):
-                     """
-                     Retorna 1 si el archivo de datos se encuentra dentro del rango de horas especificado.
-                     Inputs:
-                         filename           :    nombre completo del archivo de datos en formato Jicamarca (.r)
-                         startDate          :    fecha inicial del rango seleccionado en formato datetime.date
-                         endDate            :    fecha final del rango seleccionado en formato datetime.date
-                         startTime          :    tiempo inicial del rango seleccionado en formato datetime.time
-                         endTime            :    tiempo final del rango seleccionado en formato datetime.time
-                     Return:
-                         Boolean    :    Retorna True si el archivo de datos contiene datos en el rango de
-                                         fecha especificado, de lo contrario retorna False.
-                     Excepciones:
-                         Si el archivo no existe o no puede ser abierto
-                         Si la cabecera no puede ser leida.
-                     """
-                     try:
-                         fp = h5py.File(filename, 'r')
-                         grp1 = fp['Data']
-                     except IOError:
-                         traceback.print_exc()
-                         raise IOError("The file %s can't be opened" %(filename))
-                     #In case has utctime attribute
-                     grp2 = grp1['utctime']
-                     thisUtcTime = grp2.value[0]
-                     fp.close()
-                     if self.timezone == 'lt':
-                         thisUtcTime -= 5*3600
-                     thisDatetime = datetime.datetime.fromtimestamp(thisUtcTime + 5*3600)
-                     thisDate = thisDatetime.date()
-                     thisTime = thisDatetime.time()
-                     startUtcTime = (datetime.datetime.combine(thisDate,startTime)- datetime.datetime(1970, 1, 1)).total_seconds()
-                     endUtcTime = (datetime.datetime.combine(thisDate,endTime)- datetime.datetime(1970, 1, 1)).total_seconds()
-                     #General case
-                     #           o>>>>>>>>>>>>>><<<<<<<<<<<<<<o
-                     #-----------o----------------------------o-----------
-                     #       startTime                     endTime
-                     if endTime >= startTime:
-                         thisUtcLog = numpy.logical_and(thisUtcTime > startUtcTime, thisUtcTime < endUtcTime)
-                         if numpy.any(thisUtcLog):   #If there is one block between the hours mentioned
-                             return thisDatetime
-                         return None
-                     #If endTime < startTime then endTime belongs to the next day
-                     #<<<<<<<<<<<o                            o>>>>>>>>>>>
-                     #-----------o----------------------------o-----------
-                     #        endTime                    startTime
-                     if (thisDate == startDate) and numpy.all(thisUtcTime < startUtcTime):
-                         return None
-                     if (thisDate == endDate) and numpy.all(thisUtcTime > endUtcTime):
-                         return None
-                     if numpy.all(thisUtcTime < startUtcTime) and numpy.all(thisUtcTime > endUtcTime):
-                         return None
-                     return thisDatetime
-                 def __setNextFileOffline(self):
-                     self.fileIndex += 1
-                     idFile = self.fileIndex
-                     if not(idFile < len(self.filenameList)):
-                         raise schainpy.admin.SchainError('No more files')
+                         log.log("Searching files in {}".format(self.path), self.name)
+                         self.filenameList = self.searchFilesOffLine(self.path, self.startDate,
+                             self.endDate, self.expLabel, self.ext, self.walk, self.filefmt, self.folderfmt)
+                     self.setNextFile()
-                     filename = self.filenameList[idFile]
-                     self.fp = h5py.File(filename, 'r')
-                     self.filename = filename
+                     return
-                     print("Setting the file: %s"%self.filename)
+                 def readFirstHeader(self):
+                     '''Read metadata and data'''
-                     self.__setBlockList()
+                     self.__readMetadata()
                      self.__readData()
+                     self.__setBlockList()
                      self.blockIndex = 0
-                     return 1
+                     return
                  def __setBlockList(self):
                      '''
                      Selects the data within the times defined
                      self.fp
                      self.startTime
                      self.endTime
                      self.blockList
                      self.blocksPerFile
                      '''
-                     fp = self.fp
                      startTime = self.startTime
                      endTime = self.endTime
-                     grp = fp['Data']
-                     thisUtcTime = grp['utctime'].value
+                     index = self.listDataname.index('utctime')
+                     thisUtcTime = self.listData[index]
+                     self.interval = numpy.min(thisUtcTime[1:] - thisUtcTime[:-1])
                      if self.timezone == 'lt':
                          thisUtcTime -= 5*3600
                      thisDatetime = datetime.datetime.fromtimestamp(thisUtcTime[0] + 5*3600)
                      thisDate = thisDatetime.date()
                      thisTime = thisDatetime.time()
                      startUtcTime = (datetime.datetime.combine(thisDate,startTime) - datetime.datetime(1970, 1, 1)).total_seconds()
                      endUtcTime = (datetime.datetime.combine(thisDate,endTime) - datetime.datetime(1970, 1, 1)).total_seconds()
                      ind = numpy.where(numpy.logical_and(thisUtcTime >= startUtcTime, thisUtcTime < endUtcTime))[0]
                      self.blockList = ind
                      self.blocksPerFile = len(ind)
                      return
                  def __readMetadata(self):
                      '''
                      Reads Metadata
                      '''
-                     filename = self.filenameList[0]
-                     fp = h5py.File(filename, 'r')
-                     gp = fp['Metadata']
                      listMetaname = []
                      listMetadata = []
-                     for item in list(gp.items()):
-                         name = item[0]
-                         if name=='variables':
-                             table = gp[name][:]
-                             listShapes = {}
-                             for shapes in table:
-                                 listShapes[shapes[0].decode()] = numpy.array([shapes[1]])
-                         else:
-                             data = gp[name].value
-                             listMetaname.append(name)
-                             listMetadata.append(data)
+                     if 'Metadata' in self.fp:
+                         gp = self.fp['Metadata']
+                         for item in list(gp.items()):
+                             name = item[0]
+                             if name=='variables':
+                                 table = gp[name][:]
+                                 listShapes = {}
+                                 for shapes in table:
+                                     listShapes[shapes[0].decode()] = numpy.array([shapes[1]])
+                             else:
+                                 data = gp[name].value
+                                 listMetaname.append(name)
+                                 listMetadata.append(data)
+                     elif self.metadata:
+                         metadata = json.loads(self.metadata)
+                         listShapes = {}
+                         for tup in metadata:
+                             name, values, dim = tup
+                             if dim == -1:
+                                 listMetaname.append(name)
+                                 listMetadata.append(self.fp[values].value)
+                             else:
+                                 listShapes[name] = numpy.array([dim])
+                     else:
+                         raise IOError('Missing Metadata group in file or metadata info')
                      self.listShapes = listShapes
                      self.listMetaname = listMetaname
-                     self.listMeta = listMetadata
+                     self.listMeta = listMetadata
-                     fp.close()
                      return
                  def __readData(self):
-                     grp = self.fp['Data']
                      listdataname = []
                      listdata = []
-                     for item in list(grp.items()):
-                         name = item[0]
-                         listdataname.append(name)
-                         dim = self.listShapes[name][0]
-                         if dim == 0:
-                             array = grp[name].value
-                         else:
-                             array = []
-                             for i in range(dim):
-                                 array.append(grp[name]['table{:02d}'.format(i)].value)
-                             array = numpy.array(array)
-                         listdata.append(array)
+                     if 'Data' in self.fp:
+                         grp = self.fp['Data']
+                         for item in list(grp.items()):
+                             name = item[0]
+                             listdataname.append(name)
+                             dim = self.listShapes[name][0]
+                             if dim == 0:
+                                 array = grp[name].value
+                             else:
+                                 array = []
+                                 for i in range(dim):
+                                     array.append(grp[name]['table{:02d}'.format(i)].value)
+                                 array = numpy.array(array)
+                             listdata.append(array)
+                     elif self.metadata:
+                         metadata = json.loads(self.metadata)
+                         for tup in metadata:
+                             name, values, dim = tup
+                             listdataname.append(name)
+                             if dim == -1:
+                                 continue
+                             elif dim == 0:
+                                 array = self.fp[values].value
+                             else:
+                                 array = []
+                                 for var in values:
+                                     array.append(self.fp[var].value)
+                                 array = numpy.array(array)
+                             listdata.append(array)
+                     else:
+                         raise IOError('Missing Data group in file or metadata info')
                      self.listDataname = listdataname
                      self.listData = listdata
                      return
                  def getData(self):
                      for i in range(len(self.listMeta)):
                          setattr(self.dataOut, self.listMetaname[i], self.listMeta[i])
                      for j in range(len(self.listData)):
                          dim = self.listShapes[self.listDataname[j]][0]
                          if dim == 0:
                              setattr(self.dataOut, self.listDataname[j], self.listData[j][self.blockIndex])
                          else:
                              setattr(self.dataOut, self.listDataname[j], self.listData[j][:,self.blockIndex])
+                     self.dataOut.paramInterval = self.interval
                      self.dataOut.flagNoData = False
                      self.blockIndex += 1
                      return
                  def run(self, **kwargs):
                      if not(self.isConfig):
                          self.setup(**kwargs)
                          self.isConfig = True
                      if self.blockIndex == self.blocksPerFile:
-                         if not(self.__setNextFileOffline()):
-                             self.dataOut.flagNoData = True
-                             return 0
+                         self.setNextFile()
                      self.getData()
                      return
              @MPDecorator
              class ParameterWriter(Operation):
                  '''
                  HDF5 Writer, stores parameters data in HDF5 format files
                  path:             path where the files will be stored
                  blocksPerFile:    number of blocks that will be saved in per HDF5 format file
                  mode:             selects the data stacking mode: '0' channels, '1' parameters, '3' table (for meteors)
                  metadataList:     list of attributes that will be stored as metadata
                  dataList:         list of attributes that will be stores as data
                  '''
                  ext = ".hdf5"
                  optchar = "D"
                  metaoptchar = "M"
                  metaFile = None
                  filename = None
                  path = None
                  setFile = None
                  fp = None
                  grp = None
                  ds = None
                  firsttime = True
                  #Configurations
                  blocksPerFile = None
                  blockIndex = None
                  dataOut = None
                  #Data Arrays
                  dataList = None
                  metadataList = None
                  dsList = None   #List of dictionaries with dataset properties
                  tableDim = None
                  dtype = [('name', 'S20'),('nDim', 'i')]
                  currentDay = None
                  lastTime = None
                  def __init__(self):
                      Operation.__init__(self)
                      return
                  def setup(self, path=None, blocksPerFile=10, metadataList=None, dataList=None, setType=None):
                      self.path = path
                      self.blocksPerFile = blocksPerFile
                      self.metadataList = metadataList
                      self.dataList = dataList
                      self.setType = setType
                      tableList = []
                      dsList = []
                      for i in range(len(self.dataList)):
                          dsDict = {}
                          dataAux = getattr(self.dataOut, self.dataList[i])
                          dsDict['variable'] = self.dataList[i]
                          if dataAux is None:
                              continue
                          elif isinstance(dataAux, (int, float, numpy.integer, numpy.float)):
                              dsDict['nDim'] = 0
                          else:
                              dsDict['nDim'] = len(dataAux.shape)
                              dsDict['shape'] = dataAux.shape
                              dsDict['dsNumber'] = dataAux.shape[0]
                          dsList.append(dsDict)
                          tableList.append((self.dataList[i], dsDict['nDim']))
                      self.dsList = dsList
                      self.tableDim = numpy.array(tableList, dtype=self.dtype)
                      self.currentDay = self.dataOut.datatime.date()
                  def timeFlag(self):
                      currentTime = self.dataOut.utctime
                      timeTuple = time.localtime(currentTime)
                      dataDay = timeTuple.tm_yday
                      if self.lastTime is None:
                          self.lastTime = currentTime
                          self.currentDay = dataDay
                          return False
                      timeDiff = currentTime - self.lastTime
                      #Si el dia es diferente o si la diferencia entre un dato y otro supera la hora
                      if dataDay != self.currentDay:
                          self.currentDay = dataDay
                          return True
                      elif timeDiff > 3*60*60:
                          self.lastTime = currentTime
                          return True
                      else:
                          self.lastTime = currentTime
                          return False
                  def run(self, dataOut, path, blocksPerFile=10, metadataList=None, dataList=None, setType=None):
                      self.dataOut = dataOut
                      if not(self.isConfig):
                          self.setup(path=path, blocksPerFile=blocksPerFile,
                                     metadataList=metadataList, dataList=dataList,
                                     setType=setType)
                          self.isConfig = True
                          self.setNextFile()
                      self.putData()
                      return
                  def setNextFile(self):
                      ext = self.ext
                      path = self.path
                      setFile = self.setFile
                      timeTuple = time.localtime(self.dataOut.utctime)
                      subfolder = 'd%4.4d%3.3d' % (timeTuple.tm_year,timeTuple.tm_yday)
                      fullpath = os.path.join(path, subfolder)
                      if os.path.exists(fullpath):
                          filesList = os.listdir(fullpath)
                          filesList = [k for k in filesList if k.startswith(self.optchar)]
                          if len( filesList ) > 0:
                              filesList = sorted(filesList, key=str.lower)
                              filen = filesList[-1]
                              # el filename debera tener el siguiente formato
                              # 0 1234 567 89A BCDE (hex)
                              # x YYYY DDD SSS .ext
                              if isNumber(filen[8:11]):
                                  setFile = int(filen[8:11]) #inicializo mi contador de seteo al seteo del ultimo file
                              else:
                                  setFile = -1
                          else:
                              setFile = -1 #inicializo mi contador de seteo
                      else:
                          os.makedirs(fullpath)
                          setFile = -1 #inicializo mi contador de seteo
                      if self.setType is None:
                          setFile += 1
                          file = '%s%4.4d%3.3d%03d%s' % (self.optchar,
                                                         timeTuple.tm_year,
                                                         timeTuple.tm_yday,
                                                         setFile,
                                                         ext )
                      else:
                          setFile = timeTuple.tm_hour*60+timeTuple.tm_min
                          file = '%s%4.4d%3.3d%04d%s' % (self.optchar,
                                                         timeTuple.tm_year,
                                                         timeTuple.tm_yday,
                                                         setFile,
                                                         ext )
                      self.filename = os.path.join( path, subfolder, file )
                      #Setting HDF5 File
                      self.fp = h5py.File(self.filename, 'w')
                      #write metadata
                      self.writeMetadata(self.fp)
                      #Write data
                      self.writeData(self.fp)
                  def writeMetadata(self, fp):
                      grp = fp.create_group("Metadata")
                      grp.create_dataset('variables', data=self.tableDim, dtype=self.dtype)
                      for i in range(len(self.metadataList)):
                          if not hasattr(self.dataOut, self.metadataList[i]):
                              log.warning('Metadata: `{}` not found'.format(self.metadataList[i]), self.name)
                              continue
                          value = getattr(self.dataOut, self.metadataList[i])
                          grp.create_dataset(self.metadataList[i], data=value)
                      return
                  def writeData(self, fp):
                      grp = fp.create_group("Data")
                      dtsets = []
                      data = []
                      for dsInfo in self.dsList:
                          if dsInfo['nDim'] == 0:
                              ds = grp.create_dataset(
                                  dsInfo['variable'],
                                  (self.blocksPerFile, ),
                                  chunks=True,
                                  dtype=numpy.float64)
                              dtsets.append(ds)
                              data.append((dsInfo['variable'], -1))
                          else:
                              sgrp = grp.create_group(dsInfo['variable'])
                              for i in range(dsInfo['dsNumber']):
                                  ds = sgrp.create_dataset(
                                      'table{:02d}'.format(i),
                                      (self.blocksPerFile, ) + dsInfo['shape'][1:],
                                      chunks=True)
                                  dtsets.append(ds)
                                  data.append((dsInfo['variable'], i))
                      fp.flush()
                      log.log('Creating file: {}'.format(fp.filename), self.name)
                      self.ds = dtsets
                      self.data = data
                      self.firsttime = True
                      self.blockIndex = 0
                      return
                  def putData(self):
                      if (self.blockIndex == self.blocksPerFile) or self.timeFlag():
                          self.closeFile()
                          self.setNextFile()
                      for i, ds in enumerate(self.ds):
                          attr, ch = self.data[i]
                          if ch == -1:
                              ds[self.blockIndex] = getattr(self.dataOut, attr)
                          else:
                              ds[self.blockIndex] = getattr(self.dataOut, attr)[ch]
                      self.fp.flush()
                      self.blockIndex += 1
                      log.log('Block No. {}/{}'.format(self.blockIndex, self.blocksPerFile), self.name)
                      return
                  def closeFile(self):
                      if self.blockIndex != self.blocksPerFile:
                          for ds in self.ds:
                              ds.resize(self.blockIndex, axis=0)
                      self.fp.flush()
                      self.fp.close()
                  def close(self):
                      self.closeFile()

schainpy/model/proc/jroproc_base.py +8 -26

              '''
              Updated for multiprocessing
              Author : Sergio Cortez
              Jan 2018
              Abstract:
                  Base class for processing units and operations. A decorator provides multiprocessing features and interconnect the processes created.
                  The argument (kwargs) sent from the controller is parsed and filtered via the decorator for each processing unit or operation instantiated.
                  The decorator handle also the methods inside the processing unit to be called from the main script (not as operations) (OPERATION -> type ='self').
              Based on:
                  $Author: murco $
                  $Id: jroproc_base.py 1 2012-11-12 18:56:07Z murco $
              '''
              import os
              import inspect
              import zmq
              import time
              import pickle
              import traceback
              try:
                  from queue import Queue
              except:
                  from Queue import Queue
              from threading import Thread
              from multiprocessing import Process
              from schainpy.utils import log
              class ProcessingUnit(object):
                  """
                  Update - Jan 2018 - MULTIPROCESSING
                  All the "call" methods present in the previous base were removed.
                  The majority of operations are independant processes, thus
                  the decorator is in charge of communicate the operation processes
                  with the proccessing unit via IPC.
                  The constructor does not receive any argument. The remaining methods
                  are related with the operations to execute.
                  """
+                 proc_type = 'processing'
+                 __attrs__ = []
                  def __init__(self):
                      self.dataIn = None
                      self.dataOut = None
                      self.isConfig = False
                      self.operations = []
                      self.plots = []
                  def getAllowedArgs(self):
                      if hasattr(self, '__attrs__'):
                          return self.__attrs__
                      else:
                          return inspect.getargspec(self.run).args
                  def addOperation(self, conf, operation):
                      """
                      This method is used in the controller, and update the dictionary containing the operations to execute. The dict
                      posses the id of the operation process (IPC purposes)
                          Agrega un objeto del tipo "Operation" (opObj) a la lista de objetos "self.objectList" y retorna el
                          identificador asociado a este objeto.
                          Input:
                              object    :    objeto de la clase "Operation"
                          Return:
                              objId    :    identificador del objeto, necesario para comunicar con master(procUnit)
                      """
                      self.operations.append(
                          (operation, conf.type, conf.id, conf.getKwargs()))
                      if 'plot' in self.name.lower():
                          self.plots.append(operation.CODE)
                  def getOperationObj(self, objId):
                      if objId not in list(self.operations.keys()):
                          return None
                      return self.operations[objId]
                  def operation(self, **kwargs):
                      """
                      Operacion directa sobre la data (dataOut.data). Es necesario actualizar los valores de los
                      atributos del objeto dataOut
                      Input:
                          **kwargs    :    Diccionario de argumentos de la funcion a ejecutar
                      """
                      raise NotImplementedError
                  def setup(self):
                      raise NotImplementedError
                  def run(self):
                      raise NotImplementedError
                  def close(self):
                      return
              class Operation(object):
                  """
                  Update - Jan 2018 - MULTIPROCESSING
                  Most of the methods remained the same. The decorator parse the arguments and executed the run() method for each process.
                  The constructor doe snot receive any argument, neither the baseclass.
                      Clase base para definir las operaciones adicionales que se pueden agregar a la clase ProcessingUnit
                      y necesiten acumular informacion previa de los datos a procesar. De preferencia usar un buffer de
                      acumulacion dentro de esta clase
                      Ejemplo: Integraciones coherentes, necesita la informacion previa de los n perfiles anteriores (bufffer)
                  """
+                 proc_type = 'operation'
+                 __attrs__ = []
                  def __init__(self):
                      self.id = None
                      self.isConfig = False
                      if not hasattr(self, 'name'):
                          self.name = self.__class__.__name__
                  def getAllowedArgs(self):
                      if hasattr(self, '__attrs__'):
                          return self.__attrs__
                      else:
                          return inspect.getargspec(self.run).args
                  def setup(self):
                      self.isConfig = True
                      raise NotImplementedError
                  def run(self, dataIn, **kwargs):
                      """
                      Realiza las operaciones necesarias sobre la dataIn.data y actualiza los
                      atributos del objeto dataIn.
                      Input:
                          dataIn    :    objeto del tipo JROData
                      Return:
                          None
                      Affected:
                          __buffer    :    buffer de recepcion de datos.
                      """
                      if not self.isConfig:
                          self.setup(**kwargs)
                      raise NotImplementedError
                  def close(self):
                      return
              class InputQueue(Thread):
              	    '''
              	    Class to hold input data for Proccessing Units and external Operations,
              	    '''
              	    def __init__(self, project_id, inputId):
              	        Thread.__init__(self)
              	        self.queue = Queue()
              	        self.project_id = project_id
              	        self.inputId = inputId
              	    def run(self):
              	        c = zmq.Context()
              	        self.receiver = c.socket(zmq.SUB)
              	        self.receiver.connect(
              	            'ipc:///tmp/schain/{}_pub'.format(self.project_id))
              	        self.receiver.setsockopt(zmq.SUBSCRIBE, self.inputId.encode())
              	        while True:
              	            self.queue.put(self.receiver.recv_multipart()[1])
              	    def get(self):
              	        return pickle.loads(self.queue.get())
              def MPDecorator(BaseClass):
                  """
                  Multiprocessing class decorator
                  This function add multiprocessing features to a BaseClass. Also, it handle
                  the communication beetween processes (readers, procUnits and operations).
                  """
                  class MPClass(BaseClass, Process):
                      def __init__(self, *args, **kwargs):
                          super(MPClass, self).__init__()
                          Process.__init__(self)
                          self.operationKwargs = {}
                          self.args = args
                          self.kwargs = kwargs
                          self.sender = None
                          self.receiver = None
                          self.i = 0
                          self.t = time.time()
                          self.name = BaseClass.__name__
+                         self.__doc__ = BaseClass.__doc__
                          if 'plot' in self.name.lower() and not self.name.endswith('_'):
                              self.name = '{}{}'.format(self.CODE.upper(), 'Plot')
                          self.start_time = time.time()
                          self.id = args[0]
                          self.inputId = args[1]
                          self.project_id = args[2]
                          self.err_queue = args[3]
                          self.typeProc = args[4]
                          self.err_queue.put('#_start_#')
                          self.queue = InputQueue(self.project_id, self.inputId)
                      def subscribe(self):
                          '''
                          Start the zmq socket receiver and subcribe to input ID.
                          '''
                          self.queue.start()
                      def listen(self):
                          '''
                          This function waits for objects
                          '''
                          return self.queue.get()
                      def set_publisher(self):
                          '''
                          This function create a zmq socket for publishing objects.
                          '''
                          time.sleep(0.5)
                          c = zmq.Context()
                          self.sender = c.socket(zmq.PUB)
                          self.sender.connect(
                              'ipc:///tmp/schain/{}_sub'.format(self.project_id))
                      def publish(self, data, id):
                          '''
                          This function publish an object, to an specific topic.
                          For Read Units (inputId == None) adds a little delay
                          to avoid data loss
                          '''
                          if self.inputId is None:
                              self.i += 1
                              if self.i % 40 == 0 and time.time()-self.t > 0.1:
                                  self.i = 0
                                  self.t = time.time()
                                  time.sleep(0.05)
                              elif self.i % 40 == 0:
                                  self.i = 0
                                  self.t = time.time()
                                  time.sleep(0.01)
                          self.sender.send_multipart([str(id).encode(), pickle.dumps(data)])
                      def runReader(self):
                          '''
                          Run fuction for read units
                          '''
                          while True:
                              try:
                                  BaseClass.run(self, **self.kwargs)
                              except:
                                  err = traceback.format_exc()
                                  if 'No more files' in err:
                                      log.warning('No more files to read', self.name)
                                  else:
                                      self.err_queue.put('{}|{}'.format(self.name, err))
                                  self.dataOut.error = True
                              for op, optype, opId, kwargs in self.operations:
                                  if optype == 'self' and not self.dataOut.flagNoData:
                                      op(**kwargs)
                                  elif optype == 'other' and not self.dataOut.flagNoData:
                                      self.dataOut = op.run(self.dataOut, **self.kwargs)
                                  elif optype == 'external':
                                      self.publish(self.dataOut, opId)
                              if self.dataOut.flagNoData and not self.dataOut.error:
                                  continue
                              self.publish(self.dataOut, self.id)
                              if self.dataOut.error:
                                  break
                          time.sleep(0.5)
                      def runProc(self):
                          '''
                          Run function for proccessing units
                          '''
                          while True:
                              self.dataIn = self.listen()
                              if self.dataIn.flagNoData and self.dataIn.error is None:
                                  continue
                              elif not self.dataIn.error:
                                  try:
                                      BaseClass.run(self, **self.kwargs)
                                  except:
                                      self.err_queue.put('{}|{}'.format(self.name, traceback.format_exc()))
                                      self.dataOut.error = True
                              elif self.dataIn.error:
                                  self.dataOut.error = self.dataIn.error
                                  self.dataOut.flagNoData = True
                              for op, optype, opId, kwargs in self.operations:
                                  if optype == 'self' and not self.dataOut.flagNoData:
                                      op(**kwargs)
                                  elif optype == 'other' and not self.dataOut.flagNoData:
                                      self.dataOut = op.run(self.dataOut, **kwargs)
                                  elif optype == 'external' and not self.dataOut.flagNoData:
                                      self.publish(self.dataOut, opId)
                              self.publish(self.dataOut, self.id)
                              for op, optype, opId, kwargs in self.operations:
                                  if optype == 'external' and self.dataOut.error:
                                      self.publish(self.dataOut, opId)
                              if self.dataOut.error:
                                  break
                          time.sleep(0.5)
                      def runOp(self):
                          '''
                          Run function for external operations (this operations just receive data
                          ex: plots, writers, publishers)
                          '''
                          while True:
                              dataOut = self.listen()
                              if not dataOut.error:
                                  BaseClass.run(self, dataOut, **self.kwargs)
                              else:
                                  break
                      def run(self):
                          if self.typeProc is "ProcUnit":
                              if self.inputId is not None:
                                  self.subscribe()
                              self.set_publisher()
                              if 'Reader' not in BaseClass.__name__:
                                  self.runProc()
                              else:
                                  self.runReader()
                          elif self.typeProc is "Operation":
                              self.subscribe()
                              self.runOp()
                          else:
                              raise ValueError("Unknown type")
                          self.close()
                      def close(self):
                          BaseClass.close(self)
                          self.err_queue.put('#_end_#')
                          if self.sender:
                              self.sender.close()
                          if self.receiver:
                              self.receiver.close()
                          log.success('Done...(Time:{:4.2f} secs)'.format(time.time()-self.start_time), self.name)
                  return MPClass

General Comments 0

Write
Preview

You need to be logged in to leave comments. Login now

No TODOs yet

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages