schain Commit - r1254:6b25d3b79646 · Jicamarca Repository

Update ParamReader to support diferent HDF5 files, fix Read/Write Madrigal files

jespinoza -

r1254:6b25d3b79646

parent child

Context file:

r1254:6b25d3b79646

Collapse all files

schainpy/model/io/jroIO_kamisr.py 0 -45

		@@ -627,48 +627,3 class AMISRReader(ProcessingUnit):
627	627	self.isConfig = True
628	628
629	629	self.getData()
630
631		class Writer(Operation):
632		'''
633		classdocs
634		'''
635
636		def __init__(self):
637		'''
638		Constructor
639		'''
640		self.dataOut = None
641
642		self.isConfig = False
643
644		def setup(self, dataIn, path, blocksPerFile, set=0, ext=None):
645		'''
646		In this method we should set all initial parameters.
647
648		Input:
649		dataIn : Input data will also be outputa data
650
651		'''
652		self.dataOut = dataIn
653
654
655
656
657
658		self.isConfig = True
659
660		return
661
662		def run(self, dataIn, **kwargs):
663		'''
664		This method will be called many times so here you should put all your code
665
666		Inputs:
667
668		dataIn : object with the data
669
670		'''
671
672		if not self.isConfig:
673		self.setup(dataIn, **kwargs)
674		No newline at end of file

schainpy/model/io/jroIO_madrigal.py +110 -152

              import h5py
              import schainpy.admin
-             from schainpy.model.io.jroIO_base import LOCALTIME, JRODataReader, JRODataWriter
+             from schainpy.model.io.jroIO_base import LOCALTIME, Reader
              from schainpy.model.proc.jroproc_base import ProcessingUnit, Operation, MPDecorator
              from schainpy.model.data.jrodata import Parameters
              from schainpy.utils import log
                  return iterable
              @MPDecorator
-             class MADReader(JRODataReader, ProcessingUnit):
+             class MADReader(Reader, ProcessingUnit):
                  def __init__(self):
                      self.counter_records = 0
                      self.nrecords = None
                      self.flagNoMoreFiles = 0
-                     self.isConfig = False
                      self.filename = None
                      self.intervals = set()
+                     self.datatime = datetime.datetime(1900,1,1)
+                     self.format = None
+                     self.filefmt = "***%Y%m%d*******"
-                 def setup(self,
-                           path=None,
-                           startDate=None,
-                           endDate=None,
-                           format=None,
-                           startTime=datetime.time(0, 0, 0),
-                           endTime=datetime.time(23, 59, 59),
-                           **kwargs):
+                 def setup(self, **kwargs):
-                     self.path = path
-                     self.startDate = startDate
-                     self.endDate = endDate
-                     self.startTime = startTime
-                     self.endTime = endTime
-                     self.datatime = datetime.datetime(1900,1,1)
-                     self.oneDDict = load_json(kwargs.get('oneDDict',
-                                                          "{\"GDLATR\":\"lat\", \"GDLONR\":\"lon\"}"))
-                     self.twoDDict = load_json(kwargs.get('twoDDict',
-                                                          "{\"GDALT\": \"heightList\"}"))
-                     self.independentParam = 'GDALT'
+                     self.set_kwargs(**kwargs)
+                     self.oneDDict = load_json(self.oneDDict)
+                     self.twoDDict = load_json(self.twoDDict)
+                     self.ind2DList = load_json(self.ind2DList)
+                     self.independentParam = self.ind2DList[0]
                      if self.path is None:
                          raise ValueError('The path is not valid')
-                     if format is None:
+                     self.open_file = open
+                     self.open_mode = 'rb'
+                     if self.format is None:
                          raise ValueError('The format is not valid choose simple or hdf5')
-                     elif format.lower() in ('simple', 'txt'):
+                     elif self.format.lower() in ('simple', 'txt'):
                          self.ext = '.txt'
-                     elif format.lower() in ('cedar',):
+                     elif self.format.lower() in ('cedar',):
                          self.ext = '.001'
                      else:
                          self.ext = '.hdf5'
+                         self.open_file = h5py.File
+                         self.open_mode = 'r'
-                     self.search_files(self.path)
-                     self.fileId = 0
-                     if not self.fileList:
-                         raise  Warning('There is no files matching these date in the folder: {}. \n Check startDate and endDate'.format(path))
-                     self.setNextFile()
-                 def search_files(self, path):
-                     '''
-                      Searching for madrigal files in path
-                      Creating a list of files to procces included in [startDate,endDate]
-                      Input:
-                          path - Path to find files
-                     '''
-                     log.log('Searching files {} in {} '.format(self.ext, path), 'MADReader')
-                     fileList0 = glob.glob1(path, '*{}'.format(self.ext))
-                     fileList0.sort()
-                     self.fileList = []
-                     self.dateFileList = []
-                     startDate = self.startDate - datetime.timedelta(1)
-                     endDate = self.endDate + datetime.timedelta(1)
-                     for thisFile in fileList0:
-                         year = thisFile[3:7]
-                         if not year.isdigit():
-                             continue
-                         month = thisFile[7:9]
-                         if not month.isdigit():
-                             continue
+                     if self.online:
+                         log.log("Searching files in online mode...", self.name)
-                         day = thisFile[9:11]
-                         if not day.isdigit():
-                             continue
+                         for nTries in range(self.nTries):
+                             fullpath = self.searchFilesOnLine(self.path, self.startDate,
+                                 self.endDate, self.expLabel, self.ext, self.walk,
+                                 self.filefmt, self.folderfmt)
-                         year, month, day = int(year), int(month), int(day)
-                         dateFile = datetime.date(year, month, day)
+                             try:
+                                 fullpath = next(fullpath)
+                             except:
+                                 fullpath = None
+                             if fullpath:
+                                 break
-                         if (startDate > dateFile) or (endDate < dateFile):
-                             continue
+                             log.warning(
+                                 'Waiting {} sec for a valid file in {}: try {} ...'.format(
+                                     self.delay, self.path, nTries + 1),
+                                 self.name)
+                             time.sleep(self.delay)
+                         if not(fullpath):
+                             raise schainpy.admin.SchainError(
+                                 'There isn\'t any valid file in {}'.format(self.path))
+                     else:
+                         log.log("Searching files in {}".format(self.path), self.name)
+                         self.filenameList = self.searchFilesOffLine(self.path, self.startDate,
+                             self.endDate, self.expLabel, self.ext, self.walk, self.filefmt, self.folderfmt)
+                     self.setNextFile()
-                         self.fileList.append(thisFile)
-                         self.dateFileList.append(dateFile)
+                 def readFirstHeader(self):
+                     '''Read header and data'''
-                     return
+                     self.parseHeader()
+                     self.parseData()
+                     self.blockIndex = 0
+                     return
                  def parseHeader(self):
                      '''
                          self.times = numpy.unique(self.data['Table Layout']['ut1_unix'])
                          self.counter_records = int(self.data['Table Layout']['recno'][0])
                          self.nrecords = int(self.data['Table Layout']['recno'][-1])
-                 def setNextFile(self):
-                     '''
-                     '''
-                     file_id = self.fileId
-                     if file_id == len(self.fileList):
-                         log.success('No more files', 'MADReader')
-                         self.flagNoMoreFiles = 1
-                         return 0
-                     log.success(
-                         'Opening: {}'.format(self.fileList[file_id]),
-                         'MADReader'
+                         )
-                     filename = os.path.join(self.path, self.fileList[file_id])
-                     if self.filename is not None:
-                         self.fp.close()
-                     self.filename = filename
-                     self.filedate = self.dateFileList[file_id]
-                     if self.ext=='.hdf5':
-                         self.fp = h5py.File(self.filename, 'r')
-                     else:
-                         self.fp = open(self.filename, 'rb')
-                     self.parseHeader()
-                     self.parseData()
-                     self.sizeOfFile = os.path.getsize(self.filename)
-                     self.flagIsNewFile = 0
-                     self.fileId += 1
-                     return 1
                  def readNextBlock(self):
                      while True:
                          self.flagDiscontinuousBlock = 0
-                         if self.flagIsNewFile:
-                             if not self.setNextFile():
-                                 return 0
+                         if self.counter_records == self.nrecords:
+                             self.setNextFile()
                          self.readBlock()
                                  dum.append(self.data[self.counter_records])
                                  self.counter_records += 1
                                  if self.counter_records == self.nrecords:
-                                     self.flagIsNewFile = True
                                      break
                                  continue
                              self.intervals.add((datatime-self.datatime).seconds)
                          if datatime.date()>self.datatime.date():
                              self.flagDiscontinuousBlock = 1
                          self.datatime = datatime
-                         self.counter_records += 1
-                         if self.counter_records == self.nrecords:
-                             self.flagIsNewFile = True
+                         self.counter_records += 1
                      self.buffer = numpy.array(dum)
                      return
                      '''
                      Storing data from databuffer to dataOut object
                      '''
-                     if self.flagNoMoreFiles:
-                         self.dataOut.flagNoData = True
-                         raise schainpy.admin.SchainError('No file left to process')
-                         return 0
                      if not  self.readNextBlock():
                          self.dataOut.flagNoData = True
                      return 1
+                 def run(self, **kwargs):
+                     if not(self.isConfig):
+                         self.setup(**kwargs)
+                         self.isConfig = True
+                     self.getData()
+                     return
              @MPDecorator
              class MADWriter(Operation):
-                 missing = -32767
+                 '''Writing module for Madrigal files
+             type: external
+             Inputs:
+                         path        path where files will be created
+                         oneDDict    json of one-dimensional parameters in record where keys
+                                     are Madrigal codes (integers or mnemonics) and values the corresponding
+                                     dataOut attribute e.g: {
+                                         'gdlatr': 'lat',
+                                         'gdlonr': 'lon',
+                                         'gdlat2':'lat',
+                                         'glon2':'lon'}
+                         ind2DList   list of independent spatial two-dimensional parameters e.g:
+                                     ['heigthList']
+                         twoDDict    json of two-dimensional parameters in record where keys
+                                     are Madrigal codes (integers or mnemonics) and values the corresponding
+                                     dataOut attribute if multidimensional array specify as tupple
+                                     ('attr', pos) e.g: {
+                                         'gdalt': 'heightList',
+                                         'vn1p2': ('data_output', 0),
+                                         'vn2p2': ('data_output', 1),
+                                         'vn3': ('data_output', 2),
+                                         'snl': ('data_SNR', 'db')
+                                         }
+                         metadata    json of madrigal metadata (kinst, kindat, catalog and header)
+                         format      hdf5, cedar
+                         blocks      number of blocks per file'''
+                 __attrs__ = ['path', 'oneDDict', 'ind2DList', 'twoDDict','metadata', 'format', 'blocks']
+                 missing = -32767
                  def __init__(self):
                      self.path = None
                      self.fp = None
-                 def run(self, dataOut, path, oneDDict, independentParam='[]', twoDDict='{}',
+                 def run(self, dataOut, path, oneDDict, ind2DList='[]', twoDDict='{}',
                          metadata='{}', format='cedar', **kwargs):
-                     '''
-                     Inputs:
-                         path - path where files will be created
-                         oneDDict - json of one-dimensional parameters in record where keys
-                         are Madrigal codes (integers or mnemonics) and values the corresponding
-                         dataOut attribute e.g: {
-                             'gdlatr': 'lat',
-                             'gdlonr': 'lon',
-                             'gdlat2':'lat',
-                             'glon2':'lon'}
-                         independentParam - list of independent spatial two-dimensional parameters e.g:
-                             ['heigthList']
-                         twoDDict - json of two-dimensional parameters in record where keys
-                         are Madrigal codes (integers or mnemonics) and values the corresponding
-                         dataOut attribute if multidimensional array specify as tupple
-                         ('attr', pos) e.g: {
-                             'gdalt': 'heightList',
-                             'vn1p2': ('data_output', 0),
-                             'vn2p2': ('data_output', 1),
-                             'vn3': ('data_output', 2),
-                             'snl': ('data_SNR', 'db')
+                             }
-                         metadata - json of madrigal metadata (kinst, kindat, catalog and header)
-                     '''
                      if not self.isConfig:
-                         self.setup(path, oneDDict, independentParam, twoDDict, metadata, format, **kwargs)
+                         self.setup(path, oneDDict, ind2DList, twoDDict, metadata, format, **kwargs)
                          self.isConfig = True
                      self.dataOut = dataOut
                      self.putData()
                      return 1
-                 def setup(self, path, oneDDict, independentParam, twoDDict, metadata, format, **kwargs):
+                 def setup(self, path, oneDDict, ind2DList, twoDDict, metadata, format, **kwargs):
                      '''
                      Configure Operation
                      '''
                      self.counter = 0
                      self.oneDDict = load_json(oneDDict)
                      self.twoDDict = load_json(twoDDict)
-                     self.independentParam = load_json(independentParam)
+                     self.ind2DList = load_json(ind2DList)
                      meta = load_json(metadata)
                      self.kinst = meta.get('kinst')
                      self.kindat = meta.get('kindat')
                          self.extra_args = {}
                      elif format == 'hdf5':
                          self.ext = '.hdf5'
-                         self.extra_args = {'independentParam': self.independentParam}
+                         self.extra_args = {'ind2DList': self.ind2DList}
                      self.keys = [k.lower() for k in self.twoDDict]
                      if 'range' in self.keys:
                          log.success(
                              'Creating file: {}'.format(self.fullname),
                              'MADWriter')
+                         if not os.path.exists(self.path):
+                             os.makedirs(self.path)
                          self.fp = madrigal.cedar.MadrigalCedarFile(self.fullname, True)
                      except ValueError as e:
                          log.error(
                                  tmp = 10*numpy.log10(SNRavg)
                              else:
                                  tmp = getattr(self.dataOut, value)
-                             out[key] = tmp.flatten()
+                             out[key] = tmp.flatten()[:len(heights)]
                          elif isinstance(value, (tuple, list)):
                              attr, x = value
-                             data = getattr(self.dataOut, attr)
-                             out[key] = data[int(x)]
+                             data = getattr(self.dataOut, attr)
+                             out[key] = data[int(x)][:len(heights)]
                      a = numpy.array([out[k] for k in self.keys])
                      nrows = numpy.array([numpy.isnan(a[:, x]).all() for x in range(len(heights))])

schainpy/model/io/jroIO_param.py +123 -232

		@@ -966,218 +966,82 class ParamWriter(Operation):
966	966
967	967
968	968	@MPDecorator
969		class ParameterReader(~~JROData~~Reader,ProcessingUnit):
	969	class ParameterReader(Reader, ProcessingUnit):
970	970	'''
971	971	Reads HDF5 format files
972	972	'''
973	973
974		ext = ".hdf5"
975		optchar = "D"
976		timezone = None
977		startTime = None
978		endTime = None
979		fileIndex = None
980		blockList = None #List to blocks to be read from the file
981		blocksPerFile = None #Number of blocks to be read
982		blockIndex = None
983		path = None
984		#List of Files
985		filenameList = None
986		datetimeList = None
987		#Hdf5 File
988		listMetaname = None
989		listMeta = None
990		listDataname = None
991		listData = None
992		listShapes = None
993		fp = None
994		#dataOut reconstruction
995		dataOut = None
996
997	974	def __init__(self):
998	975	ProcessingUnit.__init__(self)
999	976	self.dataOut = Parameters()
1000		return
	977	self.ext = ".hdf5"
	978	self.optchar = "D"
	979	self.timezone = "lt"
	980	self.listMetaname = []
	981	self.listMeta = []
	982	self.listDataname = []
	983	self.listData = []
	984	self.listShapes = []
	985	self.open_file = h5py.File
	986	self.open_mode = 'r'
	987	self.metadata = False
	988	self.filefmt = "%Y%j**"
	989	self.folderfmt = "*%Y%j"
1001	990
1002	991	def setup(self, **kwargs):
1003	992
1004		path = kwargs['path']
1005		startDate = kwargs['startDate']
1006		endDate = kwargs['endDate']
1007		startTime = kwargs['startTime']
1008		endTime = kwargs['endTime']
1009		walk = kwargs['walk']
1010		if 'ext' in kwargs:
1011		ext = kwargs['ext']
1012		else:
1013		ext = '.hdf5'
1014		if 'timezone' in kwargs:
1015		self.timezone = kwargs['timezone']
1016		else:
1017		self.timezone = 'lt'
1018
1019		print("[Reading] Searching files in offline mode ...")
1020		pathList, filenameList = self.searchFilesOffLine(path, startDate=startDate, endDate=endDate,
1021		startTime=startTime, endTime=endTime,
1022		ext=ext, walk=walk)
	993	self.set_kwargs(**kwargs)
	994	if not self.ext.startswith('.'):
	995	self.ext = '.{}'.format(self.ext)
1023	996
1024		if not(filenameList):
1025		print("There is no files into the folder: %s"%(path))
1026		sys.exit(-1)
1027
1028		self.fileIndex = -1
1029		self.startTime = startTime
1030		self.endTime = endTime
1031		self.__readMetadata()
1032		self.__setNextFileOffline()
1033
1034		return
	997	if self.online:
	998	log.log("Searching files in online mode...", self.name)
1035	999
1036		def searchFilesOffLine(self, path, startDate=None, endDate=None, startTime=datetime.time(0,0,0), endTime=datetime.time(23,59,59), ext='.hdf5', walk=True):
	1000	for nTries in range(self.nTries):
	1001	fullpath = self.searchFilesOnLine(self.path, self.startDate,
	1002	self.endDate, self.expLabel, self.ext, self.walk,
	1003	self.filefmt, self.folderfmt)
1037	1004
1038		expLabel = ''
1039		self.filenameList = []
1040		self.datetimeList = []
1041		pathList = []
1042		dateList, pathList = self.findDatafiles(path, startDate, endDate, expLabel, ext, walk, include_path=True)
1043
1044		if dateList == []:
1045		print("[Reading] No *%s files in %s from %s to %s)"%(ext, path,
1046		datetime.datetime.combine(startDate,startTime).ctime(),
1047		datetime.datetime.combine(endDate,endTime).ctime()))
1048
1049		return None, None
1050
1051		if len(dateList) > 1:
1052		print("[Reading] %d days were found in date range: %s - %s" %(len(dateList), startDate, endDate))
	1005	try:
	1006	fullpath = next(fullpath)
	1007	except:
	1008	fullpath = None
	1009
	1010	if fullpath:
	1011	break
	1012
	1013	log.warning(
	1014	'Waiting {} sec for a valid file in {}: try {} ...'.format(
	1015	self.delay, self.path, nTries + 1),
	1016	self.name)
	1017	time.sleep(self.delay)
	1018
	1019	if not(fullpath):
	1020	raise schainpy.admin.SchainError(
	1021	'There isn\'t any valid file in {}'.format(self.path))
	1022
	1023	pathname, filename = os.path.split(fullpath)
	1024	self.year = int(filename[1:5])
	1025	self.doy = int(filename[5:8])
	1026	self.set = int(filename[8:11]) - 1
1053	1027	else:
1054		print("[Reading] data was found for the date %s" %(dateList[0]))
1055
1056		filenameList = []
1057		datetimeList = []
1058
1059		for thisPath in pathList:
1060
1061		fileList = glob.glob1(thisPath, "*%s" %ext)
1062		fileList.sort()
1063
1064		for file in fileList:
1065
1066		filename = os.path.join(thisPath,file)
1067
1068		if not isFileInDateRange(filename, startDate, endDate):
1069		continue
1070
1071		thisDatetime = self.__isFileInTimeRange(filename, startDate, endDate, startTime, endTime)
1072
1073		if not(thisDatetime):
1074		continue
1075
1076		filenameList.append(filename)
1077		datetimeList.append(thisDatetime)
1078
1079		if not(filenameList):
1080		print("[Reading] Any file was found int time range %s - %s" %(datetime.datetime.combine(startDate,startTime).ctime(), datetime.datetime.combine(endDate,endTime).ctime()))
1081		return None, None
1082
1083		print("[Reading] %d file(s) was(were) found in time range: %s - %s" %(len(filenameList), startTime, endTime))
1084		print()
1085
1086		self.filenameList = filenameList
1087		self.datetimeList = datetimeList
1088
1089		return pathList, filenameList
1090
1091		def __isFileInTimeRange(self,filename, startDate, endDate, startTime, endTime):
1092
1093		"""
1094		Retorna 1 si el archivo de datos se encuentra dentro del rango de horas especificado.
1095
1096		Inputs:
1097		filename : nombre completo del archivo de datos en formato Jicamarca (.r)
1098		startDate : fecha inicial del rango seleccionado en formato datetime.date
1099		endDate : fecha final del rango seleccionado en formato datetime.date
1100		startTime : tiempo inicial del rango seleccionado en formato datetime.time
1101		endTime : tiempo final del rango seleccionado en formato datetime.time
1102
1103		Return:
1104		Boolean : Retorna True si el archivo de datos contiene datos en el rango de
1105		fecha especificado, de lo contrario retorna False.
1106
1107		Excepciones:
1108		Si el archivo no existe o no puede ser abierto
1109		Si la cabecera no puede ser leida.
1110
1111		"""
1112
1113		try:
1114		fp = h5py.File(filename, 'r')
1115		grp1 = fp['Data']
1116
1117		except IOError:
1118		traceback.print_exc()
1119		raise IOError("The file %s can't be opened" %(filename))
1120		#In case has utctime attribute
1121		grp2 = grp1['utctime']
1122		thisUtcTime = grp2.value[0]
1123
1124		fp.close()
1125
1126		if self.timezone == 'lt':
1127		thisUtcTime -= 5*3600
1128
1129		thisDatetime = datetime.datetime.fromtimestamp(thisUtcTime + 5*3600)
1130		thisDate = thisDatetime.date()
1131		thisTime = thisDatetime.time()
1132
1133		startUtcTime = (datetime.datetime.combine(thisDate,startTime)- datetime.datetime(1970, 1, 1)).total_seconds()
1134		endUtcTime = (datetime.datetime.combine(thisDate,endTime)- datetime.datetime(1970, 1, 1)).total_seconds()
1135
1136		#General case
1137		# o>>>>>>>>>>>>>><<<<<<<<<<<<<<o
1138		#-----------o----------------------------o-----------
1139		# startTime endTime
1140
1141		if endTime >= startTime:
1142		thisUtcLog = numpy.logical_and(thisUtcTime > startUtcTime, thisUtcTime < endUtcTime)
1143		if numpy.any(thisUtcLog): #If there is one block between the hours mentioned
1144		return thisDatetime
1145		return None
1146
1147		#If endTime < startTime then endTime belongs to the next day
1148		#<<<<<<<<<<<o o>>>>>>>>>>>
1149		#-----------o----------------------------o-----------
1150		# endTime startTime
1151
1152		if (thisDate == startDate) and numpy.all(thisUtcTime < startUtcTime):
1153		return None
1154
1155		if (thisDate == endDate) and numpy.all(thisUtcTime > endUtcTime):
1156		return None
1157
1158		if numpy.all(thisUtcTime < startUtcTime) and numpy.all(thisUtcTime > endUtcTime):
1159		return None
1160
1161		return thisDatetime
1162
1163		def __setNextFileOffline(self):
1164
1165		self.fileIndex += 1
1166		idFile = self.fileIndex
1167
1168		if not(idFile < len(self.filenameList)):
1169		raise schainpy.admin.SchainError('No more files')
	1028	log.log("Searching files in {}".format(self.path), self.name)
	1029	self.filenameList = self.searchFilesOffLine(self.path, self.startDate,
	1030	self.endDate, self.expLabel, self.ext, self.walk, self.filefmt, self.folderfmt)
	1031
	1032	self.setNextFile()
1170	1033
1171		filename = self.filenameList[idFile]
1172		self.fp = h5py.File(filename, 'r')
1173		self.filename = filename
	1034	return
1174	1035
1175		print("Setting the file: %s"%self.filename)
	1036	def readFirstHeader(self):
	1037	'''Read metadata and data'''
1176	1038
1177		self.__~~setBlockList~~()
	1039	self.__readMetadata()
1178	1040	self.__readData()
	1041	self.__setBlockList()
1179	1042	self.blockIndex = 0
1180		~~return~~ 1
	1043
	1044	return
1181	1045
1182	1046	def __setBlockList(self):
1183	1047	'''
		@@ -1190,12 +1054,13 class ParameterReader(JRODataReader,ProcessingUnit):
1190	1054	self.blocksPerFile
1191	1055
1192	1056	'''
1193		fp = self.fp
	1057
1194	1058	startTime = self.startTime
1195	1059	endTime = self.endTime
1196	1060
1197		grp = fp['Data']
1198		thisUtcTime = ~~grp~~[~~'utctime'~~].~~value~~
	1061	index = self.listDataname.index('utctime')
	1062	thisUtcTime = self.listData[index]
	1063	self.interval = numpy.min(thisUtcTime[1:] - thisUtcTime[:-1])
1199	1064
1200	1065	if self.timezone == 'lt':
1201	1066	thisUtcTime -= 5*3600
		@@ -1219,51 +1084,78 class ParameterReader(JRODataReader,ProcessingUnit):
1219	1084	Reads Metadata
1220	1085	'''
1221	1086
1222		filename = self.filenameList[0]
1223		fp = h5py.File(filename, 'r')
1224		gp = fp['Metadata']
1225	1087	listMetaname = []
1226	1088	listMetadata = []
1227
1228		for item in list(gp.items()):
1229		name = item[0]
1230
1231		if name=='variables':
1232		table = gp[name][:]
1233		~~listShapes~~ = {}
1234		~~for~~ ~~shapes~~ in ~~table~~:
1235		listShapes[shapes[0].decode()] = numpy.array([shapes[1]])
1236		else:
1237		~~data~~ = gp[~~name~~].~~value~~
1238		~~listMetaname~~.~~append~~(~~name~~)
1239		listMeta~~data~~.append(~~data~~)
	1089	if 'Metadata' in self.fp:
	1090	gp = self.fp['Metadata']
	1091	for item in list(gp.items()):
	1092	name = item[0]
	1093
	1094	if name=='variables':
	1095	table = gp[name][:]
	1096	listShapes = {}
	1097	for shapes in table:
	1098	listShapes[shapes[0].decode()] = numpy.array([shapes[1]])
	1099	else:
	1100	data = gp[name].value
	1101	listMetaname.append(name)
	1102	listMetadata.append(data)
	1103	elif self.metadata:
	1104	metadata = json.loads(self.metadata)
	1105	listShapes = {}
	1106	for tup in metadata:
	1107	name, values, dim = tup
	1108	if dim == -1:
	1109	listMetaname.append(name)
	1110	listMetadata.append(self.fp[values].value)
	1111	else:
	1112	listShapes[name] = numpy.array([dim])
	1113	else:
	1114	raise IOError('Missing Metadata group in file or metadata info')
1240	1115
1241	1116	self.listShapes = listShapes
1242	1117	self.listMetaname = listMetaname
1243		self.listMeta = listMetadata
	1118	self.listMeta = listMetadata
1244	1119
1245		fp.close()
1246	1120	return
1247	1121
1248	1122	def __readData(self):
1249	1123
1250		grp = self.fp['Data']
1251	1124	listdataname = []
1252	1125	listdata = []
1253
1254		for item in list(grp.items()):
1255		name = item[0]
1256		listdataname.append(name)
1257		dim = self.listShapes[name][0]
1258		if dim == 0:
1259		~~array~~ = ~~grp~~[name].~~value~~
1260		else:
1261		array = []
1262		~~for~~ i in ~~range~~(~~dim~~):
1263		array.append(grp[name]['table{:02d}'.format(i)].value)
1264		array = numpy.array(array)
1265
1266		listdata.append(array)
	1126
	1127	if 'Data' in self.fp:
	1128	grp = self.fp['Data']
	1129	for item in list(grp.items()):
	1130	name = item[0]
	1131	listdataname.append(name)
	1132	dim = self.listShapes[name][0]
	1133	if dim == 0:
	1134	array = grp[name].value
	1135	else:
	1136	array = []
	1137	for i in range(dim):
	1138	array.append(grp[name]['table{:02d}'.format(i)].value)
	1139	array = numpy.array(array)
	1140
	1141	listdata.append(array)
	1142	elif self.metadata:
	1143	metadata = json.loads(self.metadata)
	1144	for tup in metadata:
	1145	name, values, dim = tup
	1146	listdataname.append(name)
	1147	if dim == -1:
	1148	continue
	1149	elif dim == 0:
	1150	array = self.fp[values].value
	1151	else:
	1152	array = []
	1153	for var in values:
	1154	array.append(self.fp[var].value)
	1155	array = numpy.array(array)
	1156	listdata.append(array)
	1157	else:
	1158	raise IOError('Missing Data group in file or metadata info')
1267	1159
1268	1160	self.listDataname = listdataname
1269	1161	self.listData = listdata
		@@ -1281,6 +1173,7 class ParameterReader(JRODataReader,ProcessingUnit):
1281	1173	else:
1282	1174	setattr(self.dataOut, self.listDataname[j], self.listData[j][:,self.blockIndex])
1283	1175
	1176	self.dataOut.paramInterval = self.interval
1284	1177	self.dataOut.flagNoData = False
1285	1178	self.blockIndex += 1
1286	1179
		@@ -1293,9 +1186,7 class ParameterReader(JRODataReader,ProcessingUnit):
1293	1186	self.isConfig = True
1294	1187
1295	1188	if self.blockIndex == self.blocksPerFile:
1296		if ~~not~~(self.__setNextFile~~Offline~~()):
1297		self.dataOut.flagNoData = True
1298		return 0
	1189	self.setNextFile()
1299	1190
1300	1191	self.getData()
1301	1192

schainpy/model/proc/jroproc_base.py +8 -26

                  """
+                 proc_type = 'processing'
+                 __attrs__ = []
                  def __init__(self):
                      Ejemplo: Integraciones coherentes, necesita la informacion previa de los n perfiles anteriores (bufffer)
                  """
+                 proc_type = 'operation'
+                 __attrs__ = []
                  def __init__(self):
              class InputQueue(Thread):
              	    '''
              	    Class to hold input data for Proccessing Units and external Operations,
              	    '''
              	    def __init__(self, project_id, inputId):
              	        Thread.__init__(self)
              	        self.queue = Queue()
              	        self.project_id = project_id
              	        self.inputId = inputId
              	    def run(self):
              	        c = zmq.Context()
              	        self.receiver = c.socket(zmq.SUB)
              	        self.receiver.connect(
              	            'ipc:///tmp/schain/{}_pub'.format(self.project_id))
              	        self.receiver.setsockopt(zmq.SUBSCRIBE, self.inputId.encode())
              	        while True:
              	            self.queue.put(self.receiver.recv_multipart()[1])
              	    def get(self):
              	        return pickle.loads(self.queue.get())
              def MPDecorator(BaseClass):
                  """
                          self.i = 0
                          self.t = time.time()
                          self.name = BaseClass.__name__
+                         self.__doc__ = BaseClass.__doc__
                          if 'plot' in self.name.lower() and not self.name.endswith('_'):
                              self.name = '{}{}'.format(self.CODE.upper(), 'Plot')

General Comments 0

Write
Preview

You need to be logged in to leave comments. Login now

No TODOs yet

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages