schain Files · schainpy/model/io/jroIO_param.py

Modificación a kmamisr para ejecutarse en la versión 3, creación de scripts con terminación v3 para difereciarlos, se comentó la linea #720 de JroIO_param.py debido a que reiniciaba la lista de archivos, ocasionando la reescritura del archivo hdf5. Alguna otra modificación aparente es producto de algunas variaciones en espacios al usar la función print()

joabAM - - Load All Authors

File last commit:

r1279:c53fe2a4a291


                r1279:c53fe2a4a291

Download file

             jroIO_param.py
        
                    1435 lines
            
             | 45.5 KiB
            
                | text/x-python
            
             |
                PythonLexer
            
             / schainpy / model / io / jroIO_param.py
          
                    History
                
                 |
                  Annotation
                 | Raw
                 |Copy content
                 |Copy permalink

      import numpy

      import time

      import os

      import h5py

      import re

      import datetime

      import schainpy.admin

      from schainpy.model.data.jrodata import *

      from schainpy.model.proc.jroproc_base import ProcessingUnit, Operation, MPDecorator

      from schainpy.model.io.jroIO_base import *

      from schainpy.utils import log

      @MPDecorator

      class ParamReader(JRODataReader,ProcessingUnit):

          '''

          Reads HDF5 format files

          path

          startDate

          endDate

          startTime

          endTime

          '''

          ext = ".hdf5"

          optchar = "D"

          timezone = None

          startTime = None

          endTime = None

          fileIndex = None

          utcList = None      #To select data in the utctime list

          blockList = None    #List to blocks to be read from the file

          blocksPerFile = None    #Number of blocks to be read

          blockIndex = None

          path = None

          #List of Files

          filenameList = None

          datetimeList = None

          #Hdf5 File

          listMetaname = None

          listMeta = None

          listDataname = None

          listData = None

          listShapes = None

          fp = None

          #dataOut reconstruction

          dataOut = None

          def __init__(self):#, **kwargs):

              ProcessingUnit.__init__(self) #, **kwargs)

              self.dataOut = Parameters()

              return

          def setup(self, **kwargs):

              path = kwargs['path']

              startDate = kwargs['startDate']

              endDate = kwargs['endDate']

              startTime = kwargs['startTime']

              endTime = kwargs['endTime']

              walk = kwargs['walk']

              if 'ext' in kwargs:

                  ext = kwargs['ext']

              else:

                  ext = '.hdf5'

              if 'timezone' in kwargs:

                  self.timezone = kwargs['timezone']

              else:

                  self.timezone = 'lt'

              print("[Reading] Searching files in offline mode ...")

              pathList, filenameList = self.searchFilesOffLine(path, startDate=startDate, endDate=endDate,

                                                                     startTime=startTime, endTime=endTime,

                                                                     ext=ext, walk=walk)

              if not(filenameList):

                  print("There is no files into the folder: %s"%(path))

                  sys.exit(-1)

              self.fileIndex = -1

              self.startTime = startTime

              self.endTime = endTime

              self.__readMetadata()

              self.__setNextFileOffline()

              return

          def searchFilesOffLine(self,

                                  path,

                                  startDate=None,

                                  endDate=None,

                                  startTime=datetime.time(0,0,0),

                                  endTime=datetime.time(23,59,59),

                                  ext='.hdf5',

                                  walk=True):

              expLabel = ''

              self.filenameList = []

              self.datetimeList = []

              pathList = []

              JRODataObj = JRODataReader()

              dateList, pathList = JRODataObj.findDatafiles(path, startDate, endDate, expLabel, ext, walk, include_path=True)

              if dateList == []:

                  print("[Reading] No *%s files in %s from %s to %s)"%(ext, path,

                                                              datetime.datetime.combine(startDate,startTime).ctime(),

                                                              datetime.datetime.combine(endDate,endTime).ctime()))

                  return None, None

              if len(dateList) > 1:

                  print("[Reading] %d days were found in date range: %s - %s" %(len(dateList), startDate, endDate))

              else:

                  print("[Reading] data was found for the date %s" %(dateList[0]))

              filenameList = []

              datetimeList = []

              #----------------------------------------------------------------------------------

              for thisPath in pathList:

                  fileList = glob.glob1(thisPath, "*%s" %ext)

                  fileList.sort()

                  for file in fileList:

                      filename = os.path.join(thisPath,file)

                      if not isFileInDateRange(filename, startDate, endDate):

                          continue

                      thisDatetime = self.__isFileInTimeRange(filename, startDate, endDate, startTime, endTime)

                      if not(thisDatetime):

                          continue

                      filenameList.append(filename)

                      datetimeList.append(thisDatetime)

              if not(filenameList):

                  print("[Reading] Any file was found int time range %s - %s" %(datetime.datetime.combine(startDate,startTime).ctime(), datetime.datetime.combine(endDate,endTime).ctime()))

                  return None, None

              print("[Reading] %d file(s) was(were) found in time range: %s - %s" %(len(filenameList), startTime, endTime))

              print()

              self.filenameList = filenameList

              self.datetimeList = datetimeList

              return pathList, filenameList

          def __isFileInTimeRange(self,filename, startDate, endDate, startTime, endTime):

              """

              Retorna 1 si el archivo de datos se encuentra dentro del rango de horas especificado.

              Inputs:

                  filename            :    nombre completo del archivo de datos en formato Jicamarca (.r)

                  startDate          :    fecha inicial del rango seleccionado en formato datetime.date

                  endDate            :    fecha final del rango seleccionado en formato datetime.date

                  startTime          :    tiempo inicial del rango seleccionado en formato datetime.time

                  endTime            :    tiempo final del rango seleccionado en formato datetime.time

              Return:

                  Boolean    :    Retorna True si el archivo de datos contiene datos en el rango de

                                  fecha especificado, de lo contrario retorna False.

              Excepciones:

                  Si el archivo no existe o no puede ser abierto

                  Si la cabecera no puede ser leida.

              """

              try:

                  fp = h5py.File(filename,'r')

                  grp1 = fp['Data']

              except IOError:

                  traceback.print_exc()

                  raise IOError("The file %s can't be opened" %(filename))

              #In case has utctime attribute

              grp2 = grp1['utctime']

       #         thisUtcTime = grp2.value[0] - 5*3600 #To convert to local time

              thisUtcTime = grp2.value[0]

              fp.close()

              if self.timezone == 'lt':

                  thisUtcTime -= 5*3600

              thisDatetime = datetime.datetime.fromtimestamp(thisUtcTime[0] + 5*3600)

              thisDate = thisDatetime.date()

              thisTime = thisDatetime.time()

              startUtcTime = (datetime.datetime.combine(thisDate,startTime)- datetime.datetime(1970, 1, 1)).total_seconds()

              endUtcTime = (datetime.datetime.combine(thisDate,endTime)- datetime.datetime(1970, 1, 1)).total_seconds()

              #General case

              #           o>>>>>>>>>>>>>><<<<<<<<<<<<<<o

              #-----------o----------------------------o-----------

              #       startTime                     endTime

              if endTime >= startTime:

                  thisUtcLog = numpy.logical_and(thisUtcTime > startUtcTime, thisUtcTime < endUtcTime)

                  if numpy.any(thisUtcLog):   #If there is one block between the hours mentioned

                      return thisDatetime

                  return None

              #If endTime < startTime then endTime belongs to the next day

              #<<<<<<<<<<<o                            o>>>>>>>>>>>

              #-----------o----------------------------o-----------

              #        endTime                    startTime

              if (thisDate == startDate) and numpy.all(thisUtcTime < startUtcTime):

                  return None

              if (thisDate == endDate) and numpy.all(thisUtcTime > endUtcTime):

                  return None

              if numpy.all(thisUtcTime < startUtcTime) and numpy.all(thisUtcTime > endUtcTime):

                  return None

              return thisDatetime

          def __setNextFileOffline(self):

              self.fileIndex += 1

              idFile = self.fileIndex

              if not(idFile < len(self.filenameList)):

                  raise schainpy.admin.SchainError("No more Files")

                  return 0

              filename = self.filenameList[idFile]

              filePointer = h5py.File(filename,'r')

              self.filename = filename

              self.fp = filePointer

              print("Setting the file: %s"%self.filename)

              self.__setBlockList()

              self.__readData()

              self.blockIndex = 0

              return 1

          def __setBlockList(self):

              '''

              Selects the data within the times defined

              self.fp

              self.startTime

              self.endTime

              self.blockList

              self.blocksPerFile

              '''

              fp = self.fp

              startTime = self.startTime

              endTime = self.endTime

              grp = fp['Data']

              thisUtcTime = grp['utctime'].value.astype(numpy.float)[0]

              #ERROOOOR

              if self.timezone == 'lt':

                  thisUtcTime -= 5*3600

              thisDatetime = datetime.datetime.fromtimestamp(thisUtcTime[0] + 5*3600)

              thisDate = thisDatetime.date()

              thisTime = thisDatetime.time()

              startUtcTime = (datetime.datetime.combine(thisDate,startTime) - datetime.datetime(1970, 1, 1)).total_seconds()

              endUtcTime = (datetime.datetime.combine(thisDate,endTime) - datetime.datetime(1970, 1, 1)).total_seconds()

              ind = numpy.where(numpy.logical_and(thisUtcTime >= startUtcTime, thisUtcTime < endUtcTime))[0]

              self.blockList = ind

              self.blocksPerFile = len(ind)

              return

          def __readMetadata(self):

              '''

              Reads Metadata

              self.pathMeta

              self.listShapes

              self.listMetaname

              self.listMeta

              '''

              filename = self.filenameList[0]

              fp = h5py.File(filename,'r')

              gp = fp['Metadata']

              listMetaname = []

              listMetadata = []

              for item in list(gp.items()):

                  name = item[0]

                  if name=='array dimensions':

                      table = gp[name][:]

                      listShapes = {}

                      for shapes in table:

                          listShapes[shapes[0]] = numpy.array([shapes[1],shapes[2],shapes[3],shapes[4],shapes[5]])

                  else:

                      data = gp[name].value

                      listMetaname.append(name)

                      listMetadata.append(data)

              self.listShapes = listShapes

              self.listMetaname = listMetaname

              self.listMeta = listMetadata

              fp.close()

              return

          def __readData(self):

              grp = self.fp['Data']

              listdataname = []

              listdata = []

              for item in list(grp.items()):

                  name = item[0]

                  listdataname.append(name)

                  array = self.__setDataArray(grp[name],self.listShapes[name])

                  listdata.append(array)

              self.listDataname = listdataname

              self.listData = listdata

              return

          def __setDataArray(self, dataset, shapes):

              nDims = shapes[0]

              nDim2 = shapes[1]      #Dimension 0

              nDim1 = shapes[2]      #Dimension 1, number of Points or Parameters

              nDim0 = shapes[3]      #Dimension 2, number of samples or ranges

              mode = shapes[4]        #Mode of storing

              blockList = self.blockList

              blocksPerFile = self.blocksPerFile

              #Depending on what mode the data was stored

              if mode == 0:       #Divided in channels

                  arrayData = dataset.value.astype(numpy.float)[0][blockList]

              if mode == 1:     #Divided in parameter

                  strds = 'table'

                  nDatas = nDim1

                  newShapes = (blocksPerFile,nDim2,nDim0)

              elif mode==2:       #Concatenated in a table

                  strds = 'table0'

                  arrayData = dataset[strds].value

                  #Selecting part of the dataset

                  utctime = arrayData[:,0]

                  u, indices = numpy.unique(utctime, return_index=True)

                  if blockList.size != indices.size:

                      indMin = indices[blockList[0]]

                      if blockList[1] + 1 >= indices.size:

                          arrayData = arrayData[indMin:,:]

                      else:

                          indMax = indices[blockList[1] + 1]

                          arrayData = arrayData[indMin:indMax,:]

                  return arrayData

              #    One dimension

              if nDims == 0:

                  arrayData = dataset.value.astype(numpy.float)[0][blockList]

              #    Two dimensions

              elif nDims == 2:

                  arrayData = numpy.zeros((blocksPerFile,nDim1,nDim0))

                  newShapes = (blocksPerFile,nDim0)

                  nDatas = nDim1

                  for i in range(nDatas):

                      data = dataset[strds + str(i)].value

                      arrayData[:,i,:] = data[blockList,:]

              #    Three dimensions

              else:

                  arrayData = numpy.zeros((blocksPerFile,nDim2,nDim1,nDim0))

                  for i in range(nDatas):

                      data = dataset[strds + str(i)].value

                      for b in range(blockList.size):

                          arrayData[b,:,i,:] = data[:,:,blockList[b]]

              return arrayData

          def __setDataOut(self):

              listMeta = self.listMeta

              listMetaname = self.listMetaname

              listDataname = self.listDataname

              listData = self.listData

              listShapes = self.listShapes

              blockIndex = self.blockIndex

       #         blockList = self.blockList

              for i in range(len(listMeta)):

                  setattr(self.dataOut,listMetaname[i],listMeta[i])

              for j in range(len(listData)):

                  nShapes = listShapes[listDataname[j]][0]

                  mode = listShapes[listDataname[j]][4]

                  if nShapes == 1:

                      setattr(self.dataOut,listDataname[j],listData[j][blockIndex])

                  elif nShapes > 1:

                      setattr(self.dataOut,listDataname[j],listData[j][blockIndex,:])

                  elif mode==0:

                      setattr(self.dataOut,listDataname[j],listData[j][blockIndex])

                  #Mode Meteors

                  elif mode ==2:

                      selectedData = self.__selectDataMode2(listData[j], blockIndex)

                      setattr(self.dataOut, listDataname[j], selectedData)

              return

          def __selectDataMode2(self, data, blockIndex):

              utctime = data[:,0]

              aux, indices = numpy.unique(utctime, return_inverse=True)

              selInd = numpy.where(indices == blockIndex)[0]

              selData = data[selInd,:]

              return selData

          def getData(self):

              if self.blockIndex==self.blocksPerFile:

                   if not( self.__setNextFileOffline() ):

                      self.dataOut.flagNoData = True

                      return 0

              self.__setDataOut()

              self.dataOut.flagNoData = False

              self.blockIndex += 1

              return

          def run(self, **kwargs):

              if not(self.isConfig):

                  self.setup(**kwargs)

                  self.isConfig = True

              self.getData()

              return

      @MPDecorator

      class ParamWriter(Operation):

          '''

          HDF5 Writer, stores parameters data in HDF5 format files

          path:             path where the files will be stored

          blocksPerFile:    number of blocks that will be saved in per HDF5 format file

          mode:             selects the data stacking mode: '0' channels, '1' parameters, '3' table (for meteors)

          metadataList:     list of attributes that will be stored as metadata

          dataList:         list of attributes that will be stores as data

          '''

          ext = ".hdf5"

          optchar = "D"

          metaoptchar = "M"

          metaFile = None

          filename = None

          path = None

          setFile = None

          fp = None

          grp = None

          ds = None

          firsttime = True

          #Configurations

          blocksPerFile = None

          blockIndex = None

          dataOut = None

          #Data Arrays

          dataList = None

          metadataList = None

          dsList = None   #List of dictionaries with dataset properties

          tableDim = None

          dtype = [('arrayName', 'S20'),('nDimensions', 'i'), ('dim2', 'i'), ('dim1', 'i'),('dim0', 'i'),('mode', 'b')]

          currentDay = None

          lastTime = None

          setType = None

          def __init__(self):

              Operation.__init__(self)

              return

          def setup(self, dataOut, path=None, blocksPerFile=10, metadataList=None, dataList=None, mode=None, setType=None):

              self.path = path

              self.blocksPerFile = blocksPerFile

              self.metadataList = metadataList

              self.dataList = dataList

              self.dataOut = dataOut

              self.mode = mode

              if self.mode is not None:

                  self.mode = numpy.zeros(len(self.dataList)) + mode

              else:

                  self.mode = numpy.ones(len(self.dataList))

              self.setType = setType

              arrayDim = numpy.zeros((len(self.dataList),5))

              #Table dimensions

              dtype0 = self.dtype

              tableList = []

              #Dictionary and list of tables

              dsList = []

              for i in range(len(self.dataList)):

                  dsDict = {}

                  dataAux = getattr(self.dataOut, self.dataList[i])

                  dsDict['variable'] = self.dataList[i]

                  #---------------------    Conditionals    ------------------------

                  #There is no data

                  if dataAux is None:

                      return 0

                  if isinstance(dataAux, (int, float, numpy.integer, numpy.float)):

                      dsDict['mode'] = 0

                      dsDict['nDim'] = 0

                      arrayDim[i,0] = 0

                      dsList.append(dsDict)

                  #Mode 2: meteors

                  elif self.mode[i] == 2:

                      dsDict['dsName'] = 'table0'

                      dsDict['mode'] = 2      # Mode meteors

                      dsDict['shape'] = dataAux.shape[-1]

                      dsDict['nDim'] = 0

                      dsDict['dsNumber'] = 1

                      arrayDim[i,3] = dataAux.shape[-1]

                      arrayDim[i,4] = self.mode[i]         #Mode the data was stored

                      dsList.append(dsDict)

                  #Mode 1

                  else:

                      arrayDim0 = dataAux.shape       #Data dimensions

                      arrayDim[i,0] = len(arrayDim0)  #Number of array dimensions

                      arrayDim[i,4] = self.mode[i]         #Mode the data was stored

                      strtable = 'table'

                      dsDict['mode'] = 1      # Mode parameters

                      # Three-dimension arrays

                      if len(arrayDim0) == 3:

                          arrayDim[i,1:-1] = numpy.array(arrayDim0)

                          nTables = int(arrayDim[i,2])

                          dsDict['dsNumber'] = nTables

                          dsDict['shape'] = arrayDim[i,2:4]

                          dsDict['nDim'] = 3

                          for j in range(nTables):

                              dsDict = dsDict.copy()

                              dsDict['dsName'] = strtable + str(j)

                              dsList.append(dsDict)

                      # Two-dimension arrays

                      elif len(arrayDim0) == 2:

                          arrayDim[i,2:-1] = numpy.array(arrayDim0)

                          nTables = int(arrayDim[i,2])

                          dsDict['dsNumber'] = nTables

                          dsDict['shape'] = arrayDim[i,3]

                          dsDict['nDim'] = 2

                          for j in range(nTables):

                              dsDict = dsDict.copy()

                              dsDict['dsName'] = strtable + str(j)

                              dsList.append(dsDict)

                      # One-dimension arrays

                      elif len(arrayDim0) == 1:

                          arrayDim[i,3] = arrayDim0[0]

                          dsDict['shape'] = arrayDim0[0]

                          dsDict['dsNumber'] = 1

                          dsDict['dsName'] = strtable + str(0)

                          dsDict['nDim'] = 1

                          dsList.append(dsDict)

                  table = numpy.array((self.dataList[i],) + tuple(arrayDim[i,:]),dtype = dtype0)

                  tableList.append(table)

              self.dsList = dsList

              self.tableDim = numpy.array(tableList, dtype = dtype0)

              self.blockIndex = 0

              timeTuple = time.localtime(dataOut.utctime)

              self.currentDay = timeTuple.tm_yday

          def putMetadata(self):

              fp = self.createMetadataFile()

              self.writeMetadata(fp)

              fp.close()

              return

          def createMetadataFile(self):

              ext = self.ext

              path = self.path

              setFile = self.setFile

              timeTuple = time.localtime(self.dataOut.utctime)

              subfolder = ''

              fullpath = os.path.join( path, subfolder )

              if not( os.path.exists(fullpath) ):

                  os.mkdir(fullpath)

                  setFile = -1 #inicializo mi contador de seteo

              subfolder = 'd%4.4d%3.3d' % (timeTuple.tm_year,timeTuple.tm_yday)

              fullpath = os.path.join( path, subfolder )

              if not( os.path.exists(fullpath) ):

                  os.mkdir(fullpath)

                  setFile = -1 #inicializo mi contador de seteo

              else:

                  filesList = os.listdir( fullpath )

                  filesList = sorted( filesList, key=str.lower )

                  if len( filesList ) > 0:

                      filesList = [k for k in filesList if k.startswith(self.metaoptchar)]

                      filen = filesList[-1]

                      # el filename debera tener el siguiente formato

                      # 0 1234 567 89A BCDE (hex)

                      # x YYYY DDD SSS .ext

                      if isNumber( filen[8:11] ):

                          setFile = int( filen[8:11] ) #inicializo mi contador de seteo al seteo del ultimo file

                      else:

                          setFile = -1

                  else:

                      setFile = -1 #inicializo mi contador de seteo

              if self.setType is None:

                  setFile += 1

                  file = '%s%4.4d%3.3d%03d%s' % (self.metaoptchar,

                                                 timeTuple.tm_year,

                                                 timeTuple.tm_yday,

                                                 setFile,

                                                 ext )

              else:

                  setFile = timeTuple.tm_hour*60+timeTuple.tm_min

                  file = '%s%4.4d%3.3d%04d%s' % (self.metaoptchar,

                                                 timeTuple.tm_year,

                                                 timeTuple.tm_yday,

                                                 setFile,

                                                 ext )

              filename = os.path.join( path, subfolder, file )

              self.metaFile = file

              #Setting HDF5 File

              fp = h5py.File(filename,'w')

              return fp

          def writeMetadata(self, fp):

              grp = fp.create_group("Metadata")

              grp.create_dataset('array dimensions', data = self.tableDim, dtype = self.dtype)

              for i in range(len(self.metadataList)):

                  grp.create_dataset(self.metadataList[i], data=getattr(self.dataOut, self.metadataList[i]))

              return

          def timeFlag(self):

              currentTime = self.dataOut.utctime

              if self.lastTime is None:

                  self.lastTime = currentTime

              #Day

              timeTuple = time.localtime(currentTime)

              dataDay = timeTuple.tm_yday

              #Time

              timeDiff = currentTime - self.lastTime

              #Si el dia es diferente o si la diferencia entre un dato y otro supera la hora

              if dataDay != self.currentDay:

                  self.currentDay = dataDay

                  return True

              elif timeDiff > 3*60*60:

                  self.lastTime = currentTime

                  return True

              else:

                  self.lastTime = currentTime

                  return False

          def setNextFile(self):

              ext = self.ext

              path = self.path

              setFile = self.setFile

              mode = self.mode

              timeTuple = time.localtime(self.dataOut.utctime)

              subfolder = 'd%4.4d%3.3d' % (timeTuple.tm_year,timeTuple.tm_yday)

              fullpath = os.path.join( path, subfolder )

              if os.path.exists(fullpath):

                  filesList = os.listdir( fullpath )

                  ##filesList = [k for k in filesList if 'M' in k]

                  if len( filesList ) > 0:

                      filesList = sorted( filesList, key=str.lower )

                      filen = filesList[-1]

                      # el filename debera tener el siguiente formato

                      # 0 1234 567 89A BCDE (hex)

                      # x YYYY DDD SSS .ext

                      if isNumber( filen[8:11] ):

                          setFile = int( filen[8:11] ) #inicializo mi contador de seteo al seteo del ultimo file

                      else:

                          setFile = -1

                  else:

                      setFile = -1 #inicializo mi contador de seteo

              else:

                  os.makedirs(fullpath)

                  setFile = -1 #inicializo mi contador de seteo

              if self.setType is None:

                  setFile += 1

                  file = '%s%4.4d%3.3d%03d%s' % (self.optchar,

                                                 timeTuple.tm_year,

                                                 timeTuple.tm_yday,

                                                 setFile,

                                                 ext )

              else:

                  setFile = timeTuple.tm_hour*60+timeTuple.tm_min

                  file = '%s%4.4d%3.3d%04d%s' % (self.optchar,

                                                 timeTuple.tm_year,

                                                 timeTuple.tm_yday,

                                                 setFile,

                                                 ext )

              filename = os.path.join( path, subfolder, file )

              #Setting HDF5 File

              fp = h5py.File(filename,'w')

              #write metadata

              self.writeMetadata(fp)

              #Write data

              grp = fp.create_group("Data")

              ds = []

              data = []

              dsList = self.dsList

              i = 0

              while i < len(dsList):

                  dsInfo = dsList[i]

                  #One-dimension data

                  if dsInfo['mode'] == 0:

                      ds0 = grp.create_dataset(dsInfo['variable'], (1,1), maxshape=(1,self.blocksPerFile) , chunks = True, dtype=numpy.float64)

                      ds.append(ds0)

                      data.append([])

                      i += 1

                      continue

                  elif dsInfo['mode'] == 2:

                      grp0 = grp.create_group(dsInfo['variable'])

                      ds0 = grp0.create_dataset(dsInfo['dsName'], (1,dsInfo['shape']), data = numpy.zeros((1,dsInfo['shape'])) , maxshape=(None,dsInfo['shape']), chunks=True)

                      ds.append(ds0)

                      data.append([])

                      i += 1

                      continue

                  elif dsInfo['mode'] == 1:

                      grp0 = grp.create_group(dsInfo['variable'])

                      for j in range(dsInfo['dsNumber']):

                          dsInfo = dsList[i]

                          tableName = dsInfo['dsName']

                          if dsInfo['nDim'] == 3:

                              shape = dsInfo['shape'].astype(int)

                              ds0 = grp0.create_dataset(tableName, (shape[0],shape[1],1) , data = numpy.zeros((shape[0],shape[1],1)), maxshape = (None,shape[1],None), chunks=True)

                          else:

                              shape = int(dsInfo['shape'])

                              ds0 = grp0.create_dataset(tableName, (1,shape), data = numpy.zeros((1,shape)) , maxshape=(None,shape), chunks=True)

                          ds.append(ds0)

                          data.append([])

                          i += 1

              fp.flush()

              fp.close()

              log.log('creating file: {}'.format(filename), 'Writing')

              self.filename = filename

              self.ds = ds

              self.data = data

              self.firsttime = True

              self.blockIndex = 0

              return

          def putData(self):

              if self.blockIndex == self.blocksPerFile or self.timeFlag():

                  self.setNextFile()

              self.readBlock()

              self.setBlock()     #Prepare data to be written

              self.writeBlock()   #Write data

              return

          def readBlock(self):

              '''

              data Array configured

              self.data

              '''

              dsList = self.dsList

              ds = self.ds

                      #Setting HDF5 File

              fp = h5py.File(self.filename,'r+')

              grp = fp["Data"]

              ind = 0

              while ind < len(dsList):

                  dsInfo = dsList[ind]

                  if dsInfo['mode'] == 0:

                      ds0 = grp[dsInfo['variable']]

                      ds[ind] = ds0

                      ind += 1

                  else:

                      grp0 = grp[dsInfo['variable']]

                      for j in range(dsInfo['dsNumber']):

                          dsInfo = dsList[ind]

                          ds0 = grp0[dsInfo['dsName']]

                          ds[ind] = ds0

                          ind += 1

              self.fp = fp

              self.grp = grp

              self.ds = ds

              return

          def setBlock(self):

              '''

              data Array configured

              self.data

              '''

              #Creating Arrays

              dsList = self.dsList

              data = self.data

              ind = 0

              while ind < len(dsList):

                  dsInfo = dsList[ind]

                  dataAux = getattr(self.dataOut, dsInfo['variable'])

                  mode = dsInfo['mode']

                  nDim = dsInfo['nDim']

                  if mode == 0 or mode == 2 or nDim == 1:

                      data[ind] = dataAux

                      ind += 1

       #             elif nDim == 1:

       #                 data[ind] = numpy.reshape(dataAux,(numpy.size(dataAux),1))

       #                 ind += 1

                  elif nDim == 2:

                      for j in range(dsInfo['dsNumber']):

                          data[ind] = dataAux[j,:]

                          ind += 1

                  elif nDim == 3:

                      for j in range(dsInfo['dsNumber']):

                          data[ind] = dataAux[:,j,:]

                          ind += 1

              self.data = data

              return

          def writeBlock(self):

              '''

              Saves the block in the HDF5 file

              '''

              dsList = self.dsList

              for i in range(len(self.ds)):

                  dsInfo = dsList[i]

                  nDim = dsInfo['nDim']

                  mode = dsInfo['mode']

                  #    First time

                  if self.firsttime:

                      if type(self.data[i]) == numpy.ndarray:

                          if nDim == 3:

                              self.data[i] = self.data[i].reshape((self.data[i].shape[0],self.data[i].shape[1],1))

                              self.ds[i].resize(self.data[i].shape)

                          if mode == 2:

                              self.ds[i].resize(self.data[i].shape)

                      self.ds[i][:] = self.data[i]

                  else:

                  #    From second time

                      #    Meteors!

                      if mode == 2:

                          dataShape = self.data[i].shape

                          dsShape = self.ds[i].shape

                          self.ds[i].resize((self.ds[i].shape[0] + dataShape[0],self.ds[i].shape[1]))

                          self.ds[i][dsShape[0]:,:] = self.data[i]

                      #    No dimension

                      elif mode == 0:

                          self.ds[i].resize((self.ds[i].shape[0], self.ds[i].shape[1] + 1))

                          self.ds[i][0,-1] = self.data[i]

                      #    One dimension

                      elif nDim == 1:

                          self.ds[i].resize((self.ds[i].shape[0] + 1, self.ds[i].shape[1]))

                          self.ds[i][-1,:] = self.data[i]

                      #    Two dimension

                      elif nDim == 2:

                          self.ds[i].resize((self.ds[i].shape[0] + 1,self.ds[i].shape[1]))

                          self.ds[i][self.blockIndex,:] = self.data[i]

                      #    Three dimensions

                      elif nDim == 3:

                          self.ds[i].resize((self.ds[i].shape[0],self.ds[i].shape[1],self.ds[i].shape[2]+1))

                          self.ds[i][:,:,-1] = self.data[i]

              self.firsttime = False

              self.blockIndex += 1

              #Close to save changes

              self.fp.flush()

              self.fp.close()

              return

          def run(self, dataOut, path, blocksPerFile=10, metadataList=None, dataList=None, mode=None, setType=None):

              self.dataOut = dataOut

              if not(self.isConfig):

                  self.setup(dataOut, path=path, blocksPerFile=blocksPerFile,

                             metadataList=metadataList, dataList=dataList, mode=mode,

                             setType=setType)

                  self.isConfig = True

                  self.setNextFile()

              self.putData()

              return

      @MPDecorator

      class ParameterReader(Reader, ProcessingUnit):

          '''

          Reads HDF5 format files

          '''

          def __init__(self):

              ProcessingUnit.__init__(self)

              self.dataOut = Parameters()

              self.ext = ".hdf5"

              self.optchar = "D"

              self.timezone = "lt"

              self.listMetaname = []

              self.listMeta = []

              self.listDataname = []

              self.listData = []

              self.listShapes = []

              self.open_file = h5py.File

              self.open_mode = 'r'

              self.metadata = False

              self.filefmt = "*%Y%j***"

              self.folderfmt = "*%Y%j"

          def setup(self, **kwargs):

              self.set_kwargs(**kwargs)

              if not self.ext.startswith('.'):

                  self.ext = '.{}'.format(self.ext)

              if self.online:

                  log.log("Searching files in online mode...", self.name)

                  for nTries in range(self.nTries):

                      fullpath = self.searchFilesOnLine(self.path, self.startDate,

                          self.endDate, self.expLabel, self.ext, self.walk,

                          self.filefmt, self.folderfmt)

                      try:

                          fullpath = next(fullpath)

                      except:

                          fullpath = None

                      if fullpath:

                          break

                      log.warning(

                          'Waiting {} sec for a valid file in {}: try {} ...'.format(

                              self.delay, self.path, nTries + 1),

                          self.name)

                      time.sleep(self.delay)

                  if not(fullpath):

                      raise schainpy.admin.SchainError(

                          'There isn\'t any valid file in {}'.format(self.path))

                  pathname, filename = os.path.split(fullpath)

                  self.year = int(filename[1:5])

                  self.doy = int(filename[5:8])

                  self.set = int(filename[8:11]) - 1

              else:

                  log.log("Searching files in {}".format(self.path), self.name)

                  self.filenameList = self.searchFilesOffLine(self.path, self.startDate,

                      self.endDate, self.expLabel, self.ext, self.walk, self.filefmt, self.folderfmt)

              self.setNextFile()

              return

          def readFirstHeader(self):

              '''Read metadata and data'''

              self.__readMetadata()

              self.__readData()

              self.__setBlockList()

              self.blockIndex = 0

              return

          def __setBlockList(self):

              '''

              Selects the data within the times defined

              self.fp

              self.startTime

              self.endTime

              self.blockList

              self.blocksPerFile

              '''

              startTime = self.startTime

              endTime = self.endTime

              index = self.listDataname.index('utctime')

              thisUtcTime = self.listData[index]

              self.interval = numpy.min(thisUtcTime[1:] - thisUtcTime[:-1])

              if self.timezone == 'lt':

                  thisUtcTime -= 5*3600

              thisDatetime = datetime.datetime.fromtimestamp(thisUtcTime[0] + 5*3600)

              thisDate = thisDatetime.date()

              thisTime = thisDatetime.time()

              startUtcTime = (datetime.datetime.combine(thisDate,startTime) - datetime.datetime(1970, 1, 1)).total_seconds()

              endUtcTime = (datetime.datetime.combine(thisDate,endTime) - datetime.datetime(1970, 1, 1)).total_seconds()

              ind = numpy.where(numpy.logical_and(thisUtcTime >= startUtcTime, thisUtcTime < endUtcTime))[0]

              self.blockList = ind

              self.blocksPerFile = len(ind)

              return

          def __readMetadata(self):

              '''

              Reads Metadata

              '''

              listMetaname = []

              listMetadata = []

              if 'Metadata' in self.fp:

                  gp = self.fp['Metadata']

                  for item in list(gp.items()):

                      name = item[0]

                      if name=='variables':

                          table = gp[name][:]

                          listShapes = {}

                          for shapes in table:

                              listShapes[shapes[0].decode()] = numpy.array([shapes[1]])

                      else:

                          data = gp[name].value

                          listMetaname.append(name)

                          listMetadata.append(data)

              elif self.metadata:

                  metadata = json.loads(self.metadata)

                  listShapes = {}

                  for tup in metadata:

                      name, values, dim = tup

                      if dim == -1:

                          listMetaname.append(name)

                          listMetadata.append(self.fp[values].value)

                      else:

                          listShapes[name] = numpy.array([dim])

              else:

                  raise IOError('Missing Metadata group in file or metadata info')

              self.listShapes = listShapes

              self.listMetaname = listMetaname

              self.listMeta = listMetadata

              return

          def __readData(self):

              listdataname = []

              listdata = []

              if 'Data' in self.fp:

                  grp = self.fp['Data']

                  for item in list(grp.items()):

                      name = item[0]

                      listdataname.append(name)

                      dim = self.listShapes[name][0]

                      if dim == 0:

                          array = grp[name].value

                      else:

                          array = []

                          for i in range(dim):

                              array.append(grp[name]['table{:02d}'.format(i)].value)

                          array = numpy.array(array)

                      listdata.append(array)

              elif self.metadata:

                  metadata = json.loads(self.metadata)

                  for tup in metadata:

                      name, values, dim = tup

                      listdataname.append(name)

                      if dim == -1:

                          continue

                      elif dim == 0:

                          array = self.fp[values].value

                      else:

                          array = []

                          for var in values:

                              array.append(self.fp[var].value)

                          array = numpy.array(array)

                      listdata.append(array)

              else:

                  raise IOError('Missing Data group in file or metadata info')

              self.listDataname = listdataname

              self.listData = listdata

              return

          def getData(self):

              for i in range(len(self.listMeta)):

                  setattr(self.dataOut, self.listMetaname[i], self.listMeta[i])

              for j in range(len(self.listData)):

                  dim = self.listShapes[self.listDataname[j]][0]

                  if dim == 0:

                      setattr(self.dataOut, self.listDataname[j], self.listData[j][self.blockIndex])

                  else:

                      setattr(self.dataOut, self.listDataname[j], self.listData[j][:,self.blockIndex])

              self.dataOut.paramInterval = self.interval

              self.dataOut.flagNoData = False

              self.blockIndex += 1

              return

          def run(self, **kwargs):

              if not(self.isConfig):

                  self.setup(**kwargs)

                  self.isConfig = True

              if self.blockIndex == self.blocksPerFile:

                  self.setNextFile()

              self.getData()

              return

      @MPDecorator

      class ParameterWriter(Operation):

          '''

          HDF5 Writer, stores parameters data in HDF5 format files

          path:             path where the files will be stored

          blocksPerFile:    number of blocks that will be saved in per HDF5 format file

          mode:             selects the data stacking mode: '0' channels, '1' parameters, '3' table (for meteors)

          metadataList:     list of attributes that will be stored as metadata

          dataList:         list of attributes that will be stores as data

          '''

          ext = ".hdf5"

          optchar = "D"

          metaoptchar = "M"

          metaFile = None

          filename = None

          path = None

          setFile = None

          fp = None

          grp = None

          ds = None

          firsttime = True

          #Configurations

          blocksPerFile = None

          blockIndex = None

          dataOut = None

          #Data Arrays

          dataList = None

          metadataList = None

          dsList = None   #List of dictionaries with dataset properties

          tableDim = None

          dtype = [('name', 'S20'),('nDim', 'i')]

          currentDay = None

          lastTime = None

          def __init__(self):

              Operation.__init__(self)

              return

          def setup(self, path=None, blocksPerFile=10, metadataList=None, dataList=None, setType=None):

              self.path = path

              self.blocksPerFile = blocksPerFile

              self.metadataList = metadataList

              self.dataList = dataList

              self.setType = setType

              tableList = []

              dsList = []

              for i in range(len(self.dataList)):

                  dsDict = {}

                  dataAux = getattr(self.dataOut, self.dataList[i])

                  dsDict['variable'] = self.dataList[i]

                  if dataAux is None:

                      continue

                  elif isinstance(dataAux, (int, float, numpy.integer, numpy.float)):

                      dsDict['nDim'] = 0

                  else:

                      dsDict['nDim'] = len(dataAux.shape)

                      dsDict['shape'] = dataAux.shape

                      dsDict['dsNumber'] = dataAux.shape[0]

                  dsList.append(dsDict)

                  tableList.append((self.dataList[i], dsDict['nDim']))

              self.dsList = dsList

              self.tableDim = numpy.array(tableList, dtype=self.dtype)

              self.currentDay = self.dataOut.datatime.date()

          def timeFlag(self):

              currentTime = self.dataOut.utctime

              timeTuple = time.localtime(currentTime)

              dataDay = timeTuple.tm_yday

              if self.lastTime is None:

                  self.lastTime = currentTime

                  self.currentDay = dataDay

                  return False

              timeDiff = currentTime - self.lastTime

              #Si el dia es diferente o si la diferencia entre un dato y otro supera la hora

              if dataDay != self.currentDay:

                  self.currentDay = dataDay

                  return True

              elif timeDiff > 3*60*60:

                  self.lastTime = currentTime

                  return True

              else:

                  self.lastTime = currentTime

                  return False

          def run(self, dataOut, path, blocksPerFile=10, metadataList=None, dataList=None, setType=None):

              self.dataOut = dataOut

              if not(self.isConfig):

                  self.setup(path=path, blocksPerFile=blocksPerFile,

                             metadataList=metadataList, dataList=dataList,

                             setType=setType)

                  self.isConfig = True

                  self.setNextFile()

              self.putData()

              return

          def setNextFile(self):

              ext = self.ext

              path = self.path

              setFile = self.setFile

              timeTuple = time.localtime(self.dataOut.utctime)

              subfolder = 'd%4.4d%3.3d' % (timeTuple.tm_year,timeTuple.tm_yday)

              fullpath = os.path.join(path, subfolder)

              if os.path.exists(fullpath):

                  filesList = os.listdir(fullpath)

                  filesList = [k for k in filesList if k.startswith(self.optchar)]

                  if len( filesList ) > 0:

                      filesList = sorted(filesList, key=str.lower)

                      filen = filesList[-1]

                      # el filename debera tener el siguiente formato

                      # 0 1234 567 89A BCDE (hex)

                      # x YYYY DDD SSS .ext

                      if isNumber(filen[8:11]):

                          setFile = int(filen[8:11]) #inicializo mi contador de seteo al seteo del ultimo file

                      else:

                          setFile = -1

                  else:

                      setFile = -1 #inicializo mi contador de seteo

              else:

                  os.makedirs(fullpath)

                  setFile = -1 #inicializo mi contador de seteo

              if self.setType is None:

                  setFile += 1

                  file = '%s%4.4d%3.3d%03d%s' % (self.optchar,

                                                 timeTuple.tm_year,

                                                 timeTuple.tm_yday,

                                                 setFile,

                                                 ext )

              else:

                  setFile = timeTuple.tm_hour*60+timeTuple.tm_min

                  file = '%s%4.4d%3.3d%04d%s' % (self.optchar,

                                                 timeTuple.tm_year,

                                                 timeTuple.tm_yday,

                                                 setFile,

                                                 ext )

              self.filename = os.path.join( path, subfolder, file )

              #Setting HDF5 File

              self.fp = h5py.File(self.filename, 'w')

              #write metadata

              self.writeMetadata(self.fp)

              #Write data

              self.writeData(self.fp)

          def writeMetadata(self, fp):

              grp = fp.create_group("Metadata")

              grp.create_dataset('variables', data=self.tableDim, dtype=self.dtype)

              for i in range(len(self.metadataList)):

                  if not hasattr(self.dataOut, self.metadataList[i]):

                      log.warning('Metadata: `{}` not found'.format(self.metadataList[i]), self.name)

                      continue

                  value = getattr(self.dataOut, self.metadataList[i])

                  grp.create_dataset(self.metadataList[i], data=value)

              return

          def writeData(self, fp):

              grp = fp.create_group("Data")

              dtsets = []

              data = []

              for dsInfo in self.dsList:

                  if dsInfo['nDim'] == 0:

                      ds = grp.create_dataset(

                          dsInfo['variable'],

                          (self.blocksPerFile, ),

                          chunks=True,

                          dtype=numpy.float64)

                      dtsets.append(ds)

                      data.append((dsInfo['variable'], -1))

                  else:

                      sgrp = grp.create_group(dsInfo['variable'])

                      for i in range(dsInfo['dsNumber']):

                          ds = sgrp.create_dataset(

                              'table{:02d}'.format(i),

                              (self.blocksPerFile, ) + dsInfo['shape'][1:],

                              chunks=True)

                          dtsets.append(ds)

                          data.append((dsInfo['variable'], i))

              fp.flush()

              log.log('Creating file: {}'.format(fp.filename), self.name)

              self.ds = dtsets

              self.data = data

              self.firsttime = True

              self.blockIndex = 0

              return

          def putData(self):

              if (self.blockIndex == self.blocksPerFile) or self.timeFlag():

                  self.closeFile()

                  self.setNextFile()

              for i, ds in enumerate(self.ds):

                  attr, ch = self.data[i]

                  if ch == -1:

                      ds[self.blockIndex] = getattr(self.dataOut, attr)

                  else:

                      ds[self.blockIndex] = getattr(self.dataOut, attr)[ch]

              self.fp.flush()

              self.blockIndex += 1

              log.log('Block No. {}/{}'.format(self.blockIndex, self.blocksPerFile), self.name)

              return

          def closeFile(self):

              if self.blockIndex != self.blocksPerFile:

                  for ds in self.ds:

                      ds.resize(self.blockIndex, axis=0)

              self.fp.flush()

              self.fp.close()

          def close(self):

              self.closeFile()

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages