schain Commit - r820:e3a794954261 · Jicamarca Repository

Bug fixes to HDF5 Writer Unit

Julio Valdez -

r820:e3a794954261

parent child

Context file:

r820:e3a794954261

Collapse all files

schainpy/model/io/jroIO_HDF5.py +5 -139

              import numpy
              import time
              import os
              import h5py
              import re
              import datetime
              from schainpy.model.data.jrodata import *
              from schainpy.model.proc.jroproc_base import ProcessingUnit, Operation
              # from jroIO_base import *
              from schainpy.model.io.jroIO_base import *
              import schainpy
              class HDF5Reader(ProcessingUnit):
                  '''
                  Reads HDF5 format files
                  path
                  startDate
                  endDate
                  startTime
                  endTime
                  '''
                  ext = ".hdf5"
                  optchar = "D"
                  timezone = None
                  startTime = None
                  endTime = None
                  fileIndex = None
                  utcList = None      #To select data in the utctime list
                  blockList = None    #List to blocks to be read from the file
                  blocksPerFile = None    #Number of blocks to be read
                  blockIndex = None
                  path = None
                  #List of Files
                  filenameList = None
                  datetimeList = None
                  #Hdf5 File
                  listMetaname = None
                  listMeta = None
                  listDataname = None
                  listData = None
                  listShapes = None
                  fp = None
                  #dataOut reconstruction
                  dataOut = None
                  def __init__(self):
                      self.dataOut = Parameters()
                      return
                  def setup(self, **kwargs):
                      path = kwargs['path']
                      startDate = kwargs['startDate']
                      endDate = kwargs['endDate']
                      startTime = kwargs['startTime']
                      endTime = kwargs['endTime']
                      walk = kwargs['walk']
                      if kwargs.has_key('ext'):
                          ext = kwargs['ext']
                      else:
                          ext = '.hdf5'
                      print "[Reading] Searching files in offline mode ..."
                      pathList, filenameList = self.__searchFilesOffLine(path, startDate=startDate, endDate=endDate,
                                                                             startTime=startTime, endTime=endTime,
                                                                             ext=ext, walk=walk)
                      if not(filenameList):
                          print "There is no files into the folder: %s"%(path)
                          sys.exit(-1)
                      self.fileIndex = -1
                      self.startTime = startTime
                      self.endTime = endTime
                      self.__readMetadata()
                      self.__setNextFileOffline()
                      return
                  def __searchFilesOffLine(self,
                                          path,
                                          startDate=None,
                                          endDate=None,
                                          startTime=datetime.time(0,0,0),
                                          endTime=datetime.time(23,59,59),
                                          ext='.hdf5',
                                          walk=True):
                      expLabel = ''
                      self.filenameList = []
                      self.datetimeList = []
                      pathList = []
                      JRODataObj = JRODataReader()
                      dateList, pathList = JRODataObj.findDatafiles(path, startDate, endDate, expLabel, ext, walk, include_path=True)
                      if dateList == []:
                          print "[Reading] No *%s files in %s from %s to %s)"%(ext, path,
                                                                      datetime.datetime.combine(startDate,startTime).ctime(),
                                                                      datetime.datetime.combine(endDate,endTime).ctime())
                          return None, None
                      if len(dateList) > 1:
                          print "[Reading] %d days were found in date range: %s - %s" %(len(dateList), startDate, endDate)
                      else:
                          print "[Reading] data was found for the date %s" %(dateList[0])
                      filenameList = []
                      datetimeList = []
                      #----------------------------------------------------------------------------------
                      for thisPath in pathList:
              #             thisPath = pathList[pathDict[file]]
                          fileList = glob.glob1(thisPath, "*%s" %ext)
                          fileList.sort()
                          for file in fileList:
                              filename = os.path.join(thisPath,file)
                              if not isFileInDateRange(filename, startDate, endDate):
                                  continue
                              thisDatetime = self.__isFileInTimeRange(filename, startDate, endDate, startTime, endTime)
                              if not(thisDatetime):
                                  continue
                              filenameList.append(filename)
                              datetimeList.append(thisDatetime)
                      if not(filenameList):
                          print "[Reading] Any file was found int time range %s - %s" %(datetime.datetime.combine(startDate,startTime).ctime(), datetime.datetime.combine(endDate,endTime).ctime())
                          return None, None
                      print "[Reading] %d file(s) was(were) found in time range: %s - %s" %(len(filenameList), startTime, endTime)
                      print
                      for i in range(len(filenameList)):
                          print "[Reading] %s -> [%s]" %(filenameList[i], datetimeList[i].ctime())
                      self.filenameList = filenameList
                      self.datetimeList = datetimeList
                      return pathList, filenameList
                  def __isFileInTimeRange(self,filename, startDate, endDate, startTime, endTime):
                      """
                      Retorna 1 si el archivo de datos se encuentra dentro del rango de horas especificado.
                      Inputs:
                          filename            :    nombre completo del archivo de datos en formato Jicamarca (.r)
                          startDate          :    fecha inicial del rango seleccionado en formato datetime.date
                          endDate            :    fecha final del rango seleccionado en formato datetime.date
                          startTime          :    tiempo inicial del rango seleccionado en formato datetime.time
                          endTime            :    tiempo final del rango seleccionado en formato datetime.time
                      Return:
                          Boolean    :    Retorna True si el archivo de datos contiene datos en el rango de
                                          fecha especificado, de lo contrario retorna False.
                      Excepciones:
                          Si el archivo no existe o no puede ser abierto
                          Si la cabecera no puede ser leida.
                      """
                      try:
                          fp = h5py.File(filename,'r')
                          grp1 = fp['Data']
                      except IOError:
                          traceback.print_exc()
                          raise IOError, "The file %s can't be opened" %(filename)
                      #chino rata
                      #In case has utctime attribute
                      grp2 = grp1['utctime']
              #         thisUtcTime = grp2.value[0] - 5*3600 #To convert to local time
                      thisUtcTime = grp2.value[0]
                      fp.close()
                      thisDatetime = datetime.datetime.fromtimestamp(thisUtcTime[0])
                      thisDate = thisDatetime.date()
                      thisTime = thisDatetime.time()
                      startUtcTime = (datetime.datetime.combine(thisDate,startTime)- datetime.datetime(1970, 1, 1)).total_seconds()
                      endUtcTime = (datetime.datetime.combine(thisDate,endTime)- datetime.datetime(1970, 1, 1)).total_seconds()
                      #General case
                      #           o>>>>>>>>>>>>>><<<<<<<<<<<<<<o
                      #-----------o----------------------------o-----------
                      #       startTime                     endTime
                      if endTime >= startTime:
                          thisUtcLog = numpy.logical_and(thisUtcTime > startUtcTime, thisUtcTime < endUtcTime)
                          if numpy.any(thisUtcLog):   #If there is one block between the hours mentioned
                              return thisDatetime
                          return None
                      #If endTime < startTime then endTime belongs to the next day
                      #<<<<<<<<<<<o                            o>>>>>>>>>>>
                      #-----------o----------------------------o-----------
                      #        endTime                    startTime
                      if (thisDate == startDate) and numpy.all(thisUtcTime < startUtcTime):
                          return None
                      if (thisDate == endDate) and numpy.all(thisUtcTime > endUtcTime):
                          return None
                      if numpy.all(thisUtcTime < startUtcTime) and numpy.all(thisUtcTime > endUtcTime):
                          return None
                      return thisDatetime
                  def __setNextFileOffline(self):
                      self.fileIndex += 1
                      idFile = self.fileIndex
                      if not(idFile < len(self.filenameList)):
                          print "No more Files"
                          return 0
                      filename = self.filenameList[idFile]
                      filePointer = h5py.File(filename,'r')
                      self.filename = filename
                      self.fp = filePointer
                      print "Setting the file: %s"%self.filename
              #         self.__readMetadata()
                      self.__setBlockList()
                      self.__readData()
              #         self.nRecords = self.fp['Data'].attrs['blocksPerFile']
              #         self.nRecords = self.fp['Data'].attrs['nRecords']
                      self.blockIndex = 0
                      return 1
                  def __setBlockList(self):
                      '''
                      Selects the data within the times defined
                      self.fp
                      self.startTime
                      self.endTime
                      self.blockList
                      self.blocksPerFile
                      '''
                      fp = self.fp
                      startTime = self.startTime
                      endTime = self.endTime
                      grp = fp['Data']
                      thisUtcTime = grp['utctime'].value.astype(numpy.float)[0]
                      if self.timezone == 'lt':
                          thisUtcTime -= 5*3600
                      thisDatetime = datetime.datetime.fromtimestamp(thisUtcTime[0])
                      thisDate = thisDatetime.date()
                      thisTime = thisDatetime.time()
                      startUtcTime = (datetime.datetime.combine(thisDate,startTime) - datetime.datetime(1970, 1, 1)).total_seconds()
                      endUtcTime = (datetime.datetime.combine(thisDate,endTime) - datetime.datetime(1970, 1, 1)).total_seconds()
                      ind = numpy.where(numpy.logical_and(thisUtcTime >= startUtcTime, thisUtcTime < endUtcTime))[0]
                      self.blockList = ind
                      self.blocksPerFile = len(ind)
                      return
                  def __readMetadata(self):
                      '''
                      Reads Metadata
                      self.pathMeta
                      self.listShapes
                      self.listMetaname
                      self.listMeta
                      '''
              #         grp = self.fp['Data']
              #         pathMeta = os.path.join(self.path, grp.attrs['metadata'])
              #
              #         if pathMeta == self.pathMeta:
              #             return
              #         else:
              #             self.pathMeta = pathMeta
              #
              #         filePointer = h5py.File(self.pathMeta,'r')
              #         groupPointer = filePointer['Metadata']
                      filename = self.filenameList[0]
                      fp = h5py.File(filename,'r')
                      gp = fp['Metadata']
                      listMetaname = []
                      listMetadata = []
                      for item in gp.items():
                          name = item[0]
                          if name=='array dimensions':
                              table = gp[name][:]
                              listShapes = {}
                              for shapes in table:
                                  listShapes[shapes[0]] = numpy.array([shapes[1],shapes[2],shapes[3],shapes[4],shapes[5]])
                          else:
                              data = gp[name].value
                              listMetaname.append(name)
                              listMetadata.append(data)
              #                 if name=='type':
              #                     self.__initDataOut(data)
                      self.listShapes = listShapes
                      self.listMetaname = listMetaname
                      self.listMeta = listMetadata
                      fp.close()
                      return
                  def __readData(self):
                      grp = self.fp['Data']
                      listdataname = []
                      listdata = []
                      for item in grp.items():
                          name = item[0]
                          listdataname.append(name)
                          array = self.__setDataArray(grp[name],self.listShapes[name])
                          listdata.append(array)
                      self.listDataname = listdataname
                      self.listData = listdata
                      return
                  def __setDataArray(self, dataset, shapes):
                      nDims = shapes[0]
                      nDim2 = shapes[1]      #Dimension 0
                      nDim1 = shapes[2]      #Dimension 1, number of Points or Parameters
                      nDim0 = shapes[3]      #Dimension 2, number of samples or ranges
                      mode = shapes[4]        #Mode of storing
                      blockList = self.blockList
                      blocksPerFile = self.blocksPerFile
                      #Depending on what mode the data was stored
              #         if mode == 0:       #Divided in channels
              #             strds = 'channel'
              #             nDatas = nDim2
              #             newShapes = (blocksPerFile,nDim1,nDim0)
                      if mode == 1:     #Divided in parameter
                          strds = 'param'
                          nDatas = nDim1
                          newShapes = (blocksPerFile,nDim2,nDim0)
                      elif mode==2:       #Concatenated in a table
                          strds = 'table0'
                          arrayData = dataset[strds].value
                          #Selecting part of the dataset
                          utctime = arrayData[:,0]
                          u, indices = numpy.unique(utctime, return_index=True)
                          if blockList.size != indices.size:
                              indMin = indices[blockList[0]]
                              indMax = indices[blockList[-1] + 1]
                              arrayData = arrayData[indMin:indMax,:]
                          return arrayData
                      #-------    One dimension ---------------
                      if nDims == 1:
                          arrayData = dataset.value.astype(numpy.float)[0][blockList]
                      #-------    Two dimensions    -----------
                      elif nDims == 2:
                          arrayData = numpy.zeros((blocksPerFile,nDim1,nDim0))
                          newShapes = (blocksPerFile,nDim0)
                          nDatas = nDim1
                          for i in range(nDatas):
                              data = dataset[strds + str(i)].value
                              arrayData[:,i,:] = data[blockList,:]
                      #-------    Three dimensions    ---------
                      else:
                          arrayData = numpy.zeros((blocksPerFile,nDim2,nDim1,nDim0))
                          for i in range(nDatas):
                              data = dataset[strds + str(i)].value
                              data = data[blockList,:,:]
                              data = data.reshape(newShapes)
              #                 if mode == 0:
              #                     arrayData[:,i,:,:] = data
              #                 else:
                              arrayData[:,:,i,:] = data
                      return arrayData
                  def __setDataOut(self):
                      listMeta = self.listMeta
                      listMetaname = self.listMetaname
                      listDataname = self.listDataname
                      listData = self.listData
                      listShapes = self.listShapes
                      blockIndex = self.blockIndex
              #         blockList = self.blockList
                      for i in range(len(listMeta)):
                          setattr(self.dataOut,listMetaname[i],listMeta[i])
                      for j in range(len(listData)):
                          nShapes = listShapes[listDataname[j]][0]
                          mode = listShapes[listDataname[j]][4]
                          if nShapes == 1:
                              setattr(self.dataOut,listDataname[j],listData[j][blockIndex])
                          elif nShapes > 1:
                              setattr(self.dataOut,listDataname[j],listData[j][blockIndex,:])
                          #Mode Meteors
                          elif mode ==2:
                              selectedData = self.__selectDataMode2(listData[j], blockIndex)
                              setattr(self.dataOut, listDataname[j], selectedData)
                      return
                  def __selectDataMode2(self, data, blockIndex):
                      utctime = data[:,0]
                      aux, indices = numpy.unique(utctime, return_inverse=True)
                      selInd = numpy.where(indices == blockIndex)[0]
                      selData = data[selInd,:]
                      return selData
                  def getData(self):
              #         if self.flagNoMoreFiles:
              #             self.dataOut.flagNoData = True
              #             print 'Process finished'
              #             return 0
              #
                      if self.blockIndex==self.blocksPerFile:
                           if not( self.__setNextFileOffline() ):
                              self.dataOut.flagNoData = True
                              return 0
              #         if self.datablock == None: # setear esta condicion cuando no hayan datos por leers
              #             self.dataOut.flagNoData = True
              #             return 0
              #         self.__readData()
                      self.__setDataOut()
                      self.dataOut.flagNoData = False
                      self.blockIndex += 1
                      return
                  def run(self, **kwargs):
                      if not(self.isConfig):
                          self.setup(**kwargs)
              #             self.setObjProperties()
                          self.isConfig = True
                      self.getData()
                      return
              class HDF5Writer(Operation):
                  '''
                  HDF5 Writer, stores parameters data in HDF5 format files
                  path:             path where the files will be stored
                  blocksPerFile:    number of blocks that will be saved in per HDF5 format file
                  mode:             selects the data stacking mode: '0' channels, '1' parameters, '3' table (for meteors)
                  metadataList:     list of attributes that will be stored as metadata
                  dataList:         list of attributes that will be stores as data
                  '''
                  ext = ".hdf5"
                  optchar = "D"
                  metaoptchar = "M"
                  metaFile = None
                  filename = None
                  path = None
                  setFile = None
                  fp = None
                  grp = None
                  ds = None
                  firsttime = True
                  #Configurations
                  blocksPerFile = None
                  blockIndex = None
                  dataOut = None
                  #Data Arrays
                  dataList = None
                  metadataList = None
              #     arrayDim = None
-                 dsList = None   #List of dictionaries
+                 dsList = None   #List of dictionaries with dataset properties
                  tableDim = None
              #     dtype = [('arrayName', 'S20'),('nChannels', 'i'), ('nPoints', 'i'), ('nSamples', 'i'),('mode', 'b')]
                  dtype = [('arrayName', 'S20'),('nDimensions', 'i'), ('dim2', 'i'), ('dim1', 'i'),('dim0', 'i'),('mode', 'b')]
-                 mode = None
-                 nDatas = None    #Number of datasets to be stored per array
-                 nDims = None  #Number Dimensions in each dataset
-                 nDimsForDs = None
                  currentDay = None
                  def __init__(self):
                      Operation.__init__(self)
                      self.isConfig = False
                      return
                  def setup(self, dataOut, **kwargs):
                      self.path = kwargs['path']
                      if kwargs.has_key('blocksPerFile'):
                          self.blocksPerFile = kwargs['blocksPerFile']
                      else:
                          self.blocksPerFile = 10
                      self.metadataList = kwargs['metadataList']
                      self.dataList = kwargs['dataList']
                      self.dataOut = dataOut
                      if kwargs.has_key('mode'):
                          mode = kwargs['mode']
                          if type(mode) == int:
                              mode = numpy.zeros(len(self.dataList)) + mode
                      else:
                          mode = numpy.ones(len(self.dataList))
                      self.mode = mode
                      arrayDim = numpy.zeros((len(self.dataList),5))
                      #Table dimensions
                      dtype0 = self.dtype
                      tableList = []
                      #Dictionary and list of tables
                      dsList = []
                      for i in range(len(self.dataList)):
                          dsDict = {}
                          dataAux = getattr(self.dataOut, self.dataList[i])
                          dsDict['variable'] = self.dataList[i]
                          #---------------------    Conditionals    ------------------------
                          #There is no data
                          if dataAux == None:
                              return 0
                          #Not array, just a number
                          #Mode 0
                          if type(dataAux)==float or type(dataAux)==int:
                              dsDict['mode'] = 0
                              dsDict['nDim'] = 0
-                             arrayDim[i,0] = 1
+                             arrayDim[i,0] = 0
                              dsList.append(dsDict)
                          #Mode 2: meteors
                          elif mode[i] == 2:
              #                 dsDict['nDim'] = 0
                              dsDict['dsName'] = 'table0'
                              dsDict['mode'] = 2      # Mode meteors
                              dsDict['shape'] = dataAux.shape[-1]
                              dsDict['nDim'] = 0
+                             dsDict['dsNumber'] = 1
                              arrayDim[i,3] = dataAux.shape[-1]
                              arrayDim[i,4] = mode[i]         #Mode the data was stored
                              dsList.append(dsDict)
                          #Mode 1
                          else:
                              arrayDim0 = dataAux.shape       #Data dimensions
                              arrayDim[i,0] = len(arrayDim0)  #Number of array dimensions
                              arrayDim[i,4] = mode[i]         #Mode the data was stored
                              strtable = 'table'
                              dsDict['mode'] = 1      # Mode parameters
                              # Three-dimension arrays
                              if len(arrayDim0) == 3:
                                  arrayDim[i,1:-1] = numpy.array(arrayDim0)
                                  nTables = int(arrayDim[i,2])
                                  dsDict['dsNumber'] = nTables
                                  dsDict['shape'] = arrayDim[i,2:4]
                                  dsDict['nDim'] = 3
                                  for j in range(nTables):
                                      dsDict = dsDict.copy()
                                      dsDict['dsName'] = strtable + str(j)
                                      dsList.append(dsDict)
                              # Two-dimension arrays
                              elif len(arrayDim0) == 2:
                                  arrayDim[i,2:-1] = numpy.array(arrayDim0)
                                  nTables = int(arrayDim[i,2])
                                  dsDict['dsNumber'] = nTables
                                  dsDict['shape'] = arrayDim[i,3]
                                  dsDict['nDim'] = 2
                                  for j in range(nTables):
                                      dsDict = dsDict.copy()
                                      dsDict['dsName'] = strtable + str(j)
                                      dsList.append(dsDict)
                              # One-dimension arrays
                              elif len(arrayDim0) == 1:
                                  arrayDim[i,3] = arrayDim0[0]
                                  dsDict['shape'] = arrayDim0[0]
                                  dsDict['dsNumber'] = 1
                                  dsDict['dsName'] = strtable + str(0)
                                  dsDict['nDim'] = 1
                                  dsList.append(dsDict)
                          table = numpy.array((self.dataList[i],) + tuple(arrayDim[i,:]),dtype = dtype0)
                          tableList.append(table)
              #         self.arrayDim = arrayDim
                      self.dsList = dsList
                      self.tableDim = numpy.array(tableList, dtype = dtype0)
                      self.blockIndex = 0
                      timeTuple = time.localtime(dataOut.utctime)
                      self.currentDay = timeTuple.tm_yday
                      return 1
                  def putMetadata(self):
                      fp = self.createMetadataFile()
                      self.writeMetadata(fp)
                      fp.close()
                      return
                  def createMetadataFile(self):
                      ext = self.ext
                      path = self.path
                      setFile = self.setFile
                      timeTuple = time.localtime(self.dataOut.utctime)
                      subfolder = ''
                      fullpath = os.path.join( path, subfolder )
                      if not( os.path.exists(fullpath) ):
                          os.mkdir(fullpath)
                          setFile = -1 #inicializo mi contador de seteo
                      subfolder = 'd%4.4d%3.3d' % (timeTuple.tm_year,timeTuple.tm_yday)
                      fullpath = os.path.join( path, subfolder )
                      if not( os.path.exists(fullpath) ):
                          os.mkdir(fullpath)
                          setFile = -1 #inicializo mi contador de seteo
                      else:
                          filesList = os.listdir( fullpath )
                          filesList = sorted( filesList, key=str.lower )
                          if len( filesList ) > 0:
                              filesList = [k for k in filesList if 'M' in k]
                              filen = filesList[-1]
                              # el filename debera tener el siguiente formato
                              # 0 1234 567 89A BCDE (hex)
                              # x YYYY DDD SSS .ext
                              if isNumber( filen[8:11] ):
                                  setFile = int( filen[8:11] ) #inicializo mi contador de seteo al seteo del ultimo file
                              else:
                                  setFile = -1
                          else:
                              setFile = -1 #inicializo mi contador de seteo
                      setFile += 1
                      file = '%s%4.4d%3.3d%3.3d%s' % (self.metaoptchar,
                                                      timeTuple.tm_year,
                                                      timeTuple.tm_yday,
                                                      setFile,
                                                      ext )
                      filename = os.path.join( path, subfolder, file )
                      self.metaFile = file
                      #Setting HDF5 File
                      fp = h5py.File(filename,'w')
                      return fp
                  def writeMetadata(self, fp):
                      grp = fp.create_group("Metadata")
                      grp.create_dataset('array dimensions', data = self.tableDim, dtype = self.dtype)
                      for i in range(len(self.metadataList)):
                          grp.create_dataset(self.metadataList[i], data=getattr(self.dataOut, self.metadataList[i]))
                      return
                  def dateFlag(self):
                      timeTuple = time.localtime(self.dataOut.utctime)
                      dataDay = timeTuple.tm_yday
                      if dataDay == self.currentDay:
                          return False
                      self.currentDay = dataDay
                      return True
                  def setNextFile(self):
                      ext = self.ext
                      path = self.path
                      setFile = self.setFile
                      mode = self.mode
                      timeTuple = time.localtime(self.dataOut.utctime)
                      subfolder = 'd%4.4d%3.3d' % (timeTuple.tm_year,timeTuple.tm_yday)
                      fullpath = os.path.join( path, subfolder )
                      if os.path.exists(fullpath):
                          filesList = os.listdir( fullpath )
                          filesList = [k for k in filesList if 'D' in k]
                          if len( filesList ) > 0:
                              filesList = sorted( filesList, key=str.lower )
                              filen = filesList[-1]
                              # el filename debera tener el siguiente formato
                              # 0 1234 567 89A BCDE (hex)
                              # x YYYY DDD SSS .ext
                              if isNumber( filen[8:11] ):
                                  setFile = int( filen[8:11] ) #inicializo mi contador de seteo al seteo del ultimo file
                              else:
                                  setFile = -1
                          else:
                              setFile = -1 #inicializo mi contador de seteo
                      else:
                          os.mkdir(fullpath)
                          setFile = -1 #inicializo mi contador de seteo
                      setFile += 1
                      file = '%s%4.4d%3.3d%3.3d%s' % (self.optchar,
                                                      timeTuple.tm_year,
                                                      timeTuple.tm_yday,
                                                      setFile,
                                                      ext )
                      filename = os.path.join( path, subfolder, file )
                      #Setting HDF5 File
                      fp = h5py.File(filename,'w')
                      #write metadata
                      self.writeMetadata(fp)
                      #Write data
                      grp = fp.create_group("Data")
              #         grp.attrs['metadata'] = self.metaFile
              #         grp.attrs['blocksPerFile'] = 0
                      ds = []
                      data = []
                      dsList = self.dsList
                      i = 0
                      while i < len(dsList):
                          dsInfo = dsList[i]
                          #One-dimension data
                          if dsInfo['mode'] == 0:
              #                 ds0 = grp.create_dataset(self.dataList[i], (1,1), maxshape=(1,self.blocksPerFile) , chunks = True, dtype='S20')
                              ds0 = grp.create_dataset(dsInfo['variable'], (1,1), maxshape=(1,self.blocksPerFile) , chunks = True, dtype=numpy.float64)
                              ds.append(ds0)
                              data.append([])
                              i += 1
                              continue
              #                 nDimsForDs.append(nDims[i])
                          elif dsInfo['mode'] == 2:
                              grp0 = grp.create_group(dsInfo['variable'])
                              ds0 = grp0.create_dataset(dsInfo['dsName'], (1,dsInfo['shape']), data = numpy.zeros((1,dsInfo['shape'])) , maxshape=(None,dsInfo['shape']), chunks=True)
                              ds.append(ds0)
                              data.append([])
                              i += 1
                              continue
                          elif dsInfo['mode'] == 1:
                              grp0 = grp.create_group(dsInfo['variable'])
                              for j in range(dsInfo['dsNumber']):
                                  dsInfo = dsList[i]
                                  tableName = dsInfo['dsName']
                                  shape = dsInfo['shape']
                                  if dsInfo['nDim'] == 3:
                                      ds0 = grp0.create_dataset(tableName, (shape[0],shape[1],1) , data = numpy.zeros((shape[0],shape[1],1)), maxshape = (None,shape[1],None), chunks=True)
                                  else:
                                      ds0 = grp0.create_dataset(tableName, (1,shape), data = numpy.zeros((1,shape)) , maxshape=(None,shape), chunks=True)
                                  ds.append(ds0)
                                  data.append([])
                                  i += 1
              #                     nDimsForDs.append(nDims[i])
                      fp.flush()
                      fp.close()
              #         self.nDatas = nDatas
              #         self.nDims = nDims
              #         self.nDimsForDs = nDimsForDs
                      #Saving variables
                      print 'Writing the file: %s'%filename
                      self.filename = filename
              #         self.fp = fp
              #         self.grp = grp
              #         self.grp.attrs.modify('nRecords', 1)
                      self.ds = ds
                      self.data = data
              #         self.setFile = setFile
                      self.firsttime = True
                      self.blockIndex = 0
                      return
-                 def setNextFile1(self):
-                     ext = self.ext
-                     path = self.path
-                     setFile = self.setFile
-                     mode = self.mode
-                     timeTuple = time.localtime(self.dataOut.utctime)
-                     subfolder = 'd%4.4d%3.3d' % (timeTuple.tm_year,timeTuple.tm_yday)
-                     fullpath = os.path.join( path, subfolder )
-                     if os.path.exists(fullpath):
-                         filesList = os.listdir( fullpath )
-                         filesList = [k for k in filesList if 'D' in k]
-                         if len( filesList ) > 0:
-                             filesList = sorted( filesList, key=str.lower )
-                             filen = filesList[-1]
-                             # el filename debera tener el siguiente formato
-                             # 0 1234 567 89A BCDE (hex)
-                             # x YYYY DDD SSS .ext
-                             if isNumber( filen[8:11] ):
-                                 setFile = int( filen[8:11] ) #inicializo mi contador de seteo al seteo del ultimo file
-                             else:
-                                 setFile = -1
-                         else:
-                             setFile = -1 #inicializo mi contador de seteo
-                     else:
-                         os.mkdir(fullpath)
-                         setFile = -1 #inicializo mi contador de seteo
-                     setFile += 1
-                     file = '%s%4.4d%3.3d%3.3d%s' % (self.optchar,
-                                                     timeTuple.tm_year,
-                                                     timeTuple.tm_yday,
-                                                     setFile,
-                                                     ext )
-                     filename = os.path.join( path, subfolder, file )
-                     #Setting HDF5 File
-                     fp = h5py.File(filename,'w')
-                     #writemetadata
-                     self.writeMetadata(fp)
-                     grp = fp.create_group("Data")
-             #         grp.attrs['metadata'] = self.metaFile
-             #         grp.attrs['blocksPerFile'] = 0
-                     ds = []
-                     data = []
-                     nDimsForDs = []
-                     nDatas = numpy.zeros(len(self.dataList))
-                     nDims = self.arrayDim[:,0]
-                     nDim1 = self.arrayDim[:,2]
-                     nDim0 = self.arrayDim[:,3]
-                     for i in range(len(self.dataList)):
-                         #One-dimension data
-                         if nDims[i]==1:
-             #                 ds0 = grp.create_dataset(self.dataList[i], (1,1), maxshape=(1,self.blocksPerFile) , chunks = True, dtype='S20')
-                             ds0 = grp.create_dataset(self.dataList[i], (1,1), maxshape=(1,self.blocksPerFile) , chunks = True, dtype=numpy.float64)
-                             ds.append(ds0)
-                             data.append([])
-                             nDimsForDs.append(nDims[i])
-                         else:
-                             #Channel mode
-             #                 if mode[i] == 0:
-             #                     strMode = "channel"
+             #
-             #                     #nDatas is the number of arrays per variable
-             #                     if nDims[i] == 1:
-             #                         nDatas[i] = self.arrayDim[i,1]
-             #                     elif nDims[i] == 2:
-             #                         nDatas[i] = self.arrayDim[i,2]
-                             #Parameters mode
-                             if mode[i] == 1:
-                                 strMode = "param"
-                                 nDatas[i] = self.arrayDim[i,2]
-                             #Meteors mode
-                             elif mode[i] == 2:
-                                 strMode = "table"
-                                 nDatas[i] = 1
-                             grp0 = grp.create_group(self.dataList[i])
-                             for j in range(int(nDatas[i])):
-                                 tableName = strMode + str(j)
-                                 if nDims[i] == 3:
-                                     ds0 = grp0.create_dataset(tableName, (nDim1[i],nDim0[i],1) , data = numpy.zeros((nDim1[i],nDim0[i],1)) ,maxshape=(None,nDim0[i],None), chunks=True)
-                                 else:
-                                     ds0 = grp0.create_dataset(tableName, (1,nDim0[i]), data = numpy.zeros((1,nDim0[i])) , maxshape=(None,nDim0[i]), chunks=True)
-                                 ds.append(ds0)
-                                 data.append([])
-                                 nDimsForDs.append(nDims[i])
-                     fp.flush()
-                     fp.close()
-                     self.nDatas = nDatas
-                     self.nDims = nDims
-                     self.nDimsForDs = nDimsForDs
-                     #Saving variables
-                     print 'Writing the file: %s'%filename
-                     self.filename = filename
-             #         self.fp = fp
-             #         self.grp = grp
-             #         self.grp.attrs.modify('nRecords', 1)
-                     self.ds = ds
-                     self.data = data
+             #
-             #         self.setFile = setFile
-                     self.firsttime = True
-                     self.blockIndex = 0
-                     return
                  def putData(self):
                      if self.blockIndex == self.blocksPerFile or self.dateFlag():
                          self.setNextFile()
              #         if not self.firsttime:
                      self.readBlock()
                      self.setBlock()     #Prepare data to be written
                      self.writeBlock()   #Write data
                      return
                  def readBlock(self):
                      '''
                      data Array configured
                      self.data
                      '''
                      dsList = self.dsList
                      ds = self.ds
                              #Setting HDF5 File
                      fp = h5py.File(self.filename,'r+')
                      grp = fp["Data"]
                      ind = 0
              #         grp.attrs['blocksPerFile'] = 0
                      while ind < len(dsList):
                          dsInfo = dsList[ind]
                          if dsInfo['mode'] == 0:
                              ds0 = grp[dsInfo['variable']]
                              ds[ind] = ds0
                              ind += 1
                          else:
                              grp0 = grp[dsInfo['variable']]
                              for j in range(dsInfo['dsNumber']):
                                  dsInfo = dsList[ind]
                                  ds0 = grp0[dsInfo['dsName']]
                                  ds[ind] = ds0
                                  ind += 1
                      self.fp = fp
                      self.grp = grp
                      self.ds = ds
                      return
                  def setBlock(self):
                      '''
                      data Array configured
                      self.data
                      '''
                      #Creating Arrays
                      dsList = self.dsList
                      data = self.data
                      ind = 0
                      while ind < len(dsList):
                          dsInfo = dsList[ind]
                          dataAux = getattr(self.dataOut, dsInfo['variable'])
                          mode = dsInfo['mode']
                          nDim = dsInfo['nDim']
                          if mode == 0 or mode == 2 or nDim == 1:
                              data[ind] = dataAux
                              ind += 1
              #             elif nDim == 1:
              #                 data[ind] = numpy.reshape(dataAux,(numpy.size(dataAux),1))
              #                 ind += 1
                          elif nDim == 2:
                              for j in range(dsInfo['dsNumber']):
                                  data[ind] = dataAux[j,:]
                                  ind += 1
                          elif nDim == 3:
                              for j in range(dsInfo['dsNumber']):
                                  data[ind] = dataAux[:,j,:]
                                  ind += 1
                      self.data = data
                      return
                  def writeBlock(self):
                      '''
                      Saves the block in the HDF5 file
                      '''
                      dsList = self.dsList
                      for i in range(len(self.ds)):
                          dsInfo = dsList[i]
                          nDim = dsInfo['nDim']
                          mode = dsInfo['mode']
                          #    First time
                          if self.firsttime:
              #                 self.ds[i].resize(self.data[i].shape)
              #                 self.ds[i][self.blockIndex,:] = self.data[i]
                              if type(self.data[i]) == numpy.ndarray:
                                  if nDim == 3:
                                      self.data[i] = self.data[i].reshape((self.data[i].shape[0],self.data[i].shape[1],1))
                                      self.ds[i].resize(self.data[i].shape)
+                                 if mode == 2:
+                                     self.ds[i].resize(self.data[i].shape)
                              self.ds[i][:] = self.data[i]
                          else:
                          #    From second time
                              #    Meteors!
                              if mode == 2:
                                  dataShape = self.data[i].shape
                                  dsShape = self.ds[i].shape
                                  self.ds[i].resize((self.ds[i].shape[0] + dataShape[0],self.ds[i].shape[1]))
                                  self.ds[i][dsShape[0]:,:] = self.data[i]
                              #    No dimension
                              elif mode == 0:
                                  self.ds[i].resize((self.ds[i].shape[0], self.ds[i].shape[1] + 1))
                                  self.ds[i][0,-1] = self.data[i]
                              #    One dimension
                              elif nDim == 1:
                                  self.ds[i].resize((self.ds[i].shape[0] + 1, self.ds[i].shape[1]))
                                  self.ds[i][-1,:] = self.data[i]
                              #    Two dimension
                              elif nDim == 2:
                                  self.ds[i].resize((self.ds[i].shape[0] + 1,self.ds[i].shape[1]))
                                  self.ds[i][self.blockIndex,:] = self.data[i]
                              #    Three dimensions
                              elif nDim == 3:
                                  self.ds[i].resize((self.ds[i].shape[0],self.ds[i].shape[1],self.ds[i].shape[2]+1))
                                  self.ds[i][:,:,-1] = self.data[i]
                      self.firsttime = False
                      self.blockIndex += 1
                      #Close to save changes
                      self.fp.flush()
                      self.fp.close()
                      return
                  def run(self, dataOut, **kwargs):
                      if not(self.isConfig):
                          flagdata = self.setup(dataOut, **kwargs)
                          if not(flagdata):
                              return
                          self.isConfig = True
              #             self.putMetadata()
                          self.setNextFile()
                      self.putData()
                      return

General Comments 0

Write
Preview

You need to be logged in to leave comments. Login now

No TODOs yet

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages