hawk-utils-scripts/monitoring/db/scripts/get_detailed_power.py

#!/usr/bin/env python3

import argparse
import numpy as np
from collections import OrderedDict
import os.path


def parse_arguments(args):
	parser = argparse.ArgumentParser(
				description='Produce detailed power usage data for a list of jobids.')
	parser.add_argument('-v', '--verbose', action='store_true',
				help='Show database querries, etc.')
	parser.add_argument('-t', '--interval', action='store', type=float, default=5.0,
				help="Interval between power values in seconds")
	parser.add_argument('--hawk-ai', action='store_true',
				help="Job did run on Hawk-AI")
	parser.add_argument('jobid', type=parse_jobid,
			nargs='+', 
			help='Job ID such as "2260215" or "2260215.hawk-pbs5"')
    
	return parser.parse_args(args)

def parse_jobid(s):
	import re
	hawkpbs = r'.hawk-pbs5'
	jobid = re.sub(hawkpbs, '', s)
	not_allowed = r'[^0-9\[\]]' # Jobid can be more complex than just digits, eg 2444420[201]
	if re.search(not_allowed, jobid): 
		raise argparse.ArgumentTypeError(f'invalid job ID "{s}"')
	return jobid


class Power:
	def __init__(self, nodes):
		self.nodes = nodes
		self.epochs = None
		self.first_ts = None
		self.last_ts = None
		self.warnings = ""

	@classmethod
	def from_list(cls, data):
		"""
		Returns a Power instance from a list of tuples (timestamp, node, value).

		Assumptions:
		 - data is sorted by timestamp ascending
		 - for each timestamp, there is the same set of nodes and in the same order
		"""

		idx_ts = 0; idx_node = 1; idx_value = 2
		nodes = list(OrderedDict.fromkeys([line[idx_node] for line in data]))   # preserves order of nodes
		power = Power(nodes)

		values = {}
		for l in data:
			ts = l[idx_ts]
			if ts not in values:
				values[ts] = []
			value = l[idx_value]
			values[ts].append(value)

		epochs = values.keys()
		for epoch in epochs:
			power.insert_epoch(epoch, values[epoch])

		# check implicit assumptions: 1) ts/epochs are sorted
		e = list(epochs)
		k = list(values.keys())
		if not e == k:
			power.warnings += "# Warning: Unexpected unsorted timestamps.\n"

		# check implicit assumptions: 2) each line has #nodes values
		nnodes = len(nodes)
		for epoch in epochs:
			actual = len(values[epoch])
			if actual != nnodes:
				power.warnings += "# Warning: Unexpected number of nodes ({actual}/{expected})\n".format(actual=actual, expected=nnodes)
				break
		
		return power

	@classmethod
	def from_db(cls, db, jobid, interval, hawk_ai):
		df = db.db_to_pf(jobid, interval, hawk_ai)
		power = cls.from_pandas(df, {'time': 'time', 'name': 'node', 'avg': 'power'})

		return power

	@classmethod
	def from_pandas(cls, dataframe, columns):
		dataframe.rename(columns=columns, inplace=True)
		by_node = dataframe.groupby('node')
		nodes = list(by_node.groups.keys())

		power = cls(nodes)
		power.epochs = dataframe.groupby('time')
		times = list(power.epochs.groups.keys())
		power.first_ts, power.last_ts = times[0], times[-1]
		power.dataframe = dataframe
		power.by_node = power.dataframe.groupby('node')
		power.energy = power.summarize_energy()

		return power

	def to_file(self, jobid, header=""):
		"""Dumps power data to file. Returns filename is succesfull and None if unsucessfull."""
		fname = self.filename(jobid)
		if os.path.exists(fname):
			print("Error: cowardly refusing to overwrite file ", fname)
			return None

		header += self.warnings
		header += self.energy
		try:
			with open(fname, "w+") as f:
				f.write(header + self.header())
				f.write(self.body())
		except IOError:
			print("Error: could not write to file ", fname)
			fname = None

		return fname
	
	def insert_epoch(self, ts, values):
		self.epochs[ts] = values
		if not self.first_ts:
			self.first_ts = ts
		self.last_ts = ts

	def header(self):
		hd  = "# all timestamp have unit miliseconds since unix epoch\n"
		hd += "# all power values have unit Watt\n"
		hd += "timestamp,RESERVED,head_node_power,avg_node_power,median_node_power,min_node_power,max_node_power,std_dev_node_power"
		# add node names here instead
		hd += "," + ",".join(self.nodes)
		hd += "\n"
		return hd

	def body(self):
		_body = ""
		for epoch in self.epochs:
			_body += self.pretty_print(*self.summarize_epoch(epoch))
		return _body
	
	def summarize_time(self, ts):
		return Power.to_csv(ts, "")

	@staticmethod
	def summarize_values(df):
		values = df['power'].values
		head = values[0]
		min, max = values.min(), values.max()
		avg, stddev = values.mean(), values.std()
		median = np.median(values)
		return Power.to_csv(head, avg, median, min, max, stddev)

	def summarize_epoch(self, epoch):
		ts, values = epoch
		return self.summarize_time(ts), \
				self.summarize_values(values), \
				self.all_values(values)

	def all_values(self, values):
		# reindex frame to get all nodes; introduces gaps
		values = values[['node', 'power']].set_index('node').reindex(self.nodes)
		# hack to_csv() to transpose array
		csv = values.to_csv(header=False, index=False, line_terminator=',', na_rep=' ')
		csv = csv[:-1]  # strip line terminator ',' from end of string
		return csv

	def energy_total(self):
		energy = None
		if hasattr(self, "by_node"):
			energy = self.by_node.apply(self.energy_node).sum()
		return energy
	
	@staticmethod
	def energy_node(group):
		"""Left-sided Riemann sum is enough, as time is lower bound of bucket"""
		delta_t = group["time"].diff().shift(-1)/1000.  # in seconds
		pow =  group['power']
		return (delta_t * pow).iloc[:-1].sum()	

	def summarize_energy(self):
		return "# Total energy consumed by job: {energy:.0f} J\n".format(energy=self.energy_total())

	@staticmethod
	def to_csv(*args):
		return ",".join(str(a) for a in args)
	
	@staticmethod
	def pretty_print(*args):
		return Power.to_csv(*args) + '\n'

	def filename(self, jobid):
		fname = "detailed_power_{jobid}.hawk-pbs5.{first}-{last}.csv".format(
			jobid=jobid, first=self.first_ts, last=self.last_ts
		)
		return fname
	

class MonitoringDB:
	QUERY_STRING_HAWK = """
-- For description of get_job_data(), see https://kb.hlrs.de/monitoring/index.php/TimescaleDB_-_Query_Guidelines#Function:_get_job_data_and_get_ai_job_data
select * from get_job_data(
		'{jobid}.hawk-pbs5',
		'cmc_power_racktraynodepoweravg',   -- power data source
		'{interval} seconds', 
		array['avg'],          -- aggregation: average across samples in bucket
		array['time','node']   -- sort by time first than node (ascending)
)
as t(time bigint, name varchar, avg double precision);
"""

	QUERY_STRING_HAWK_AI = """
-- For description of get_ai_job_data(), see https://kb.hlrs.de/monitoring/index.php/TimescaleDB_-_Query_Guidelines#Function:_get_job_data_and_get_ai_job_data
select * from get_ai_job_data(
		'{jobid}.hawk-pbs5',
		'telegraf_ipmi_power_meter',   -- power data source
		'{interval} seconds', 
		array['avg'],          -- aggregation: average across samples in bucket
		array['time','node']   -- sort by time first than node (ascending)
)
as t(time bigint, name varchar, avg double precision);
"""

	def __init__(self, verbose):
		self.connection = self.init_db(verbose)

	@staticmethod
	def init_db(verbose):
		import sqlalchemy as db
		engine = db.create_engine('postgresql://hpc@hawk-monitor4:5432/coe_mon', echo=verbose)
		connection = engine.connect()
		return connection

	def close_db(self):
		return self.connection.close()

	@classmethod
	def build_query(cls, jobid, interval, hawk_ai):
		import sqlalchemy as db
		if hawk_ai:
			query_string = cls.QUERY_STRING_HAWK_AI
		else:
			query_string = cls.QUERY_STRING_HAWK
		return db.text(query_string.format(jobid=jobid, interval=interval))

	def db_to_list(self, jobid, interval, hawk_ai):
		query = self.build_query(jobid, interval, hawk_ai)
		return self.connection.execute(query).fetchall()

	def db_to_pf(self, jobid, interval, hawk_ai):
		import pandas as pd
		query = self.build_query(jobid, interval, hawk_ai)
		return pd.read_sql(query, con=self.connection)


class App:
	def __init__(self, config):
		self.config = config
		self.db = MonitoringDB(self.config.verbose)

	@staticmethod
	def warnings(config):
		warn = ""
		if not config.hawk_ai and config.interval < 5: 
			warn += '# Warning: interval<5 is very small and may lead to data gaps.'
		if config.hawk_ai and config.interval < 60:
			warn += '# Warning: interval<60 is very small for Hawk-AI nodes and may lead to data gaps.'
		return warn
	
	def run_all(self):
		warnings = self.warnings(self.config)
		if warnings:
			print(warnings)

		header = f"# {self.config.datetime}: {self.config.cmd}\n"
		if warnings:
			header +=  f"{warnings}\n"
		header += "#\n"

		for jobid in self.config.jobid:
			try:
				power = Power.from_db(self.db, jobid, self.config.interval, self.config.hawk_ai)
			except RuntimeError:
				print('No data found for job ID "{}"'.format(jobid))
				continue

			fn = power.to_file(jobid, header)
			if fn:
				print('Created file {fn}'.format(fn=fn))
			if power.warnings:
				print(power.warnings)
			if power.energy:
				print(power.energy)		

if __name__ == "__main__":
	import sys
	from datetime import datetime
	config = parse_arguments(sys.argv[1:])
	config.cmd = " ".join(sys.argv)
	config.datetime = f"{datetime.now()}"

	main = App(config)
	main.run_all()
Add python3 shebang 2023-11-22 15:04:30 +00:00			`#!/usr/bin/env python3`

Add missing import statement 2023-11-20 10:39:11 +00:00			`import argparse`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`import numpy as np`
			`from collections import OrderedDict`
			`import os.path`

Add argument parser 2023-11-17 15:25:51 +00:00
Decouple argument parser from sys.argv 2023-11-22 13:35:19 +00:00			`def parse_arguments(args):`
Add argument parser 2023-11-17 15:25:51 +00:00			`parser = argparse.ArgumentParser(`
			`description='Produce detailed power usage data for a list of jobids.')`
			`parser.add_argument('-v', '--verbose', action='store_true',`
			`help='Show database querries, etc.')`
Add argument for interval and report in output 2023-11-22 13:45:14 +00:00			`parser.add_argument('-t', '--interval', action='store', type=float, default=5.0,`
			`help="Interval between power values in seconds")`
Add query and warnings for hawk-ai jobs 2024-02-07 14:54:13 +00:00			`parser.add_argument('--hawk-ai', action='store_true',`
			`help="Job did run on Hawk-AI")`
Add argument parser 2023-11-17 15:25:51 +00:00			`parser.add_argument('jobid', type=parse_jobid,`
Outline main into class 2023-11-22 09:30:36 +00:00			`nargs='+',`
Add missing import statement 2023-11-20 10:39:11 +00:00			`help='Job ID such as "2260215" or "2260215.hawk-pbs5"')`
Add argument parser 2023-11-17 15:25:51 +00:00
Decouple argument parser from sys.argv 2023-11-22 13:35:19 +00:00			`return parser.parse_args(args)`
Add argument parser 2023-11-17 15:25:51 +00:00
			`def parse_jobid(s):`
			`import re`
			`hawkpbs = r'.hawk-pbs5'`
			`jobid = re.sub(hawkpbs, '', s)`
Improve parsing of job IDs 2024-02-15 10:06:54 +00:00			`not_allowed = r'[^0-9\[\]]' # Jobid can be more complex than just digits, eg 2444420[201]`
			`if re.search(not_allowed, jobid):`
Add argument parser 2023-11-17 15:25:51 +00:00			`raise argparse.ArgumentTypeError(f'invalid job ID "{s}"')`
			`return jobid`

Add prototype to query job power from database 2023-10-26 14:19:16 +00:00
			`class Power:`
Power class knows nothing about actual delta_t in outputs 2024-02-12 15:29:25 +00:00			`def __init__(self, nodes):`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`self.nodes = nodes`
Refactor class Power to use pandas dataframes 2024-02-20 13:21:12 +00:00			`self.epochs = None`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`self.first_ts = None`
			`self.last_ts = None`
Save warnings in output 2024-02-15 09:29:45 +00:00			`self.warnings = ""`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00
			`@classmethod`
			`def from_list(cls, data):`
State and check assumptions in Power.from_list() 2024-02-12 15:45:13 +00:00			`"""`
			`Returns a Power instance from a list of tuples (timestamp, node, value).`

			`Assumptions:`
Preserve order of nodes 2024-02-12 16:19:50 +00:00			`- data is sorted by timestamp ascending`
			`- for each timestamp, there is the same set of nodes and in the same order`
State and check assumptions in Power.from_list() 2024-02-12 15:45:13 +00:00			`"""`

Swap order of query output tuple 2024-02-07 09:20:13 +00:00			`idx_ts = 0; idx_node = 1; idx_value = 2`
Preserve order of nodes 2024-02-12 16:19:50 +00:00			`nodes = list(OrderedDict.fromkeys([line[idx_node] for line in data])) # preserves order of nodes`
Refactor variable name 2024-02-13 13:34:08 +00:00			`power = Power(nodes)`
Remove/comment debug output 2023-11-20 15:04:19 +00:00
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`values = {}`
			`for l in data:`
Swap order of query output tuple 2024-02-07 09:20:13 +00:00			`ts = l[idx_ts]`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`if ts not in values:`
			`values[ts] = []`
Refactor variable name 2024-02-13 13:34:08 +00:00			`value = l[idx_value]`
			`values[ts].append(value)`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00
State and check assumptions in Power.from_list() 2024-02-12 15:45:13 +00:00			`epochs = values.keys()`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`for epoch in epochs:`
Refactor variable name 2024-02-13 13:34:08 +00:00			`power.insert_epoch(epoch, values[epoch])`
State and check assumptions in Power.from_list() 2024-02-12 15:45:13 +00:00
			`# check implicit assumptions: 1) ts/epochs are sorted`
			`e = list(epochs)`
			`k = list(values.keys())`
			`if not e == k:`
Save warnings in output 2024-02-15 09:29:45 +00:00			`power.warnings += "# Warning: Unexpected unsorted timestamps.\n"`
State and check assumptions in Power.from_list() 2024-02-12 15:45:13 +00:00
			`# check implicit assumptions: 2) each line has #nodes values`
			`nnodes = len(nodes)`
			`for epoch in epochs:`
			`actual = len(values[epoch])`
			`if actual != nnodes:`
Save warnings in output 2024-02-15 09:29:45 +00:00			`power.warnings += "# Warning: Unexpected number of nodes ({actual}/{expected})\n".format(actual=actual, expected=nnodes)`
State and check assumptions in Power.from_list() 2024-02-12 15:45:13 +00:00			`break`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00
Refactor variable name 2024-02-13 13:34:08 +00:00			`return power`
Rearrange class methods 2023-11-20 14:53:52 +00:00
Add factory function for power from data base 2023-11-22 08:01:05 +00:00			`@classmethod`
Add query and warnings for hawk-ai jobs 2024-02-07 14:54:13 +00:00			`def from_db(cls, db, jobid, interval, hawk_ai):`
Refactor class Power to use pandas dataframes 2024-02-20 13:21:12 +00:00			`df = db.db_to_pf(jobid, interval, hawk_ai)`
			`power = cls.from_pandas(df, {'time': 'time', 'name': 'node', 'avg': 'power'})`
Error handling for jobid without data 2023-11-22 09:52:49 +00:00
Refactor class Power to use pandas dataframes 2024-02-20 13:21:12 +00:00			`return power`
Add argument for interval and report in output 2023-11-22 13:45:14 +00:00
Refactor class Power to use pandas dataframes 2024-02-20 13:21:12 +00:00			`@classmethod`
			`def from_pandas(cls, dataframe, columns):`
			`dataframe.rename(columns=columns, inplace=True)`
			`by_node = dataframe.groupby('node')`
			`nodes = list(by_node.groups.keys())`

			`power = cls(nodes)`
			`power.epochs = dataframe.groupby('time')`
Fix timestamps for filename 2024-02-20 15:52:27 +00:00			`times = list(power.epochs.groups.keys())`
			`power.first_ts, power.last_ts = times[0], times[-1]`
Refactor class Power to use pandas dataframes 2024-02-20 13:21:12 +00:00			`power.dataframe = dataframe`
			`power.by_node = power.dataframe.groupby('node')`
Read into pandas dataframe to compute consumed energy 2024-02-16 15:01:28 +00:00			`power.energy = power.summarize_energy()`

Refactor class Power to use pandas dataframes 2024-02-20 13:21:12 +00:00			`return power`

Log command line in output files 2024-02-07 10:31:30 +00:00			`def to_file(self, jobid, header=""):`
Rearrange class methods 2023-11-20 14:53:52 +00:00			`"""Dumps power data to file. Returns filename is succesfull and None if unsucessfull."""`
			`fname = self.filename(jobid)`
			`if os.path.exists(fname):`
			`print("Error: cowardly refusing to overwrite file ", fname)`
			`return None`

Save warnings in output 2024-02-15 09:29:45 +00:00			`header += self.warnings`
Read into pandas dataframe to compute consumed energy 2024-02-16 15:01:28 +00:00			`header += self.energy`
Rearrange class methods 2023-11-20 14:53:52 +00:00			`try:`
			`with open(fname, "w+") as f:`
Log command line in output files 2024-02-07 10:31:30 +00:00			`f.write(header + self.header())`
Rearrange class methods 2023-11-20 14:53:52 +00:00			`f.write(self.body())`
			`except IOError:`
Fix unknown symbol 2023-11-22 13:46:51 +00:00			`print("Error: could not write to file ", fname)`
Rearrange class methods 2023-11-20 14:53:52 +00:00			`fname = None`

			`return fname`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00
Rearrange class methods 2023-11-20 14:53:52 +00:00			`def insert_epoch(self, ts, values):`
			`self.epochs[ts] = values`
			`if not self.first_ts:`
			`self.first_ts = ts`
			`self.last_ts = ts`

Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`def header(self):`
			`hd = "# all timestamp have unit miliseconds since unix epoch\n"`
			`hd += "# all power values have unit Watt\n"`
Power class knows nothing about actual delta_t in outputs 2024-02-12 15:29:25 +00:00			`hd += "timestamp,RESERVED,head_node_power,avg_node_power,median_node_power,min_node_power,max_node_power,std_dev_node_power"`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`# add node names here instead`
Add nodes to output 2024-02-12 16:36:03 +00:00			`hd += "," + ",".join(self.nodes)`
			`hd += "\n"`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`return hd`

Rearrange class methods 2023-11-20 14:53:52 +00:00			`def body(self):`
			`_body = ""`
Refactor class Power to use pandas dataframes 2024-02-20 13:21:12 +00:00			`for epoch in self.epochs:`
Use variable-length method arguments for convenience 2024-02-21 13:41:19 +00:00			`_body += self.pretty_print(*self.summarize_epoch(epoch))`
Rearrange class methods 2023-11-20 14:53:52 +00:00			`return _body`

Add argument for interval and report in output 2023-11-22 13:45:14 +00:00			`def summarize_time(self, ts):`
Use variable-length method arguments for convenience 2024-02-21 13:41:19 +00:00			`return Power.to_csv(ts, "")`
Rearrange class methods 2023-11-20 14:53:52 +00:00
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`@staticmethod`
Refactor class Power to use pandas dataframes 2024-02-20 13:21:12 +00:00			`def summarize_values(df):`
			`values = df['power'].values`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`head = values[0]`
			`min, max = values.min(), values.max()`
			`avg, stddev = values.mean(), values.std()`
			`median = np.median(values)`
Use variable-length method arguments for convenience 2024-02-21 13:41:19 +00:00			`return Power.to_csv(head, avg, median, min, max, stddev)`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00
Add argument for interval and report in output 2023-11-22 13:45:14 +00:00			`def summarize_epoch(self, epoch):`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`ts, values = epoch`
Print power values of all nodes, including missing ones 2024-02-20 15:51:32 +00:00			`return self.summarize_time(ts), \`
			`self.summarize_values(values), \`
			`self.all_values(values)`
Refactor class Power to use pandas dataframes 2024-02-20 13:21:12 +00:00
			`def all_values(self, values):`
Print power values of all nodes, including missing ones 2024-02-20 15:51:32 +00:00			`# reindex frame to get all nodes; introduces gaps`
			`values = values[['node', 'power']].set_index('node').reindex(self.nodes)`
			`# hack to_csv() to transpose array`
			`csv = values.to_csv(header=False, index=False, line_terminator=',', na_rep=' ')`
			`csv = csv[:-1] # strip line terminator ',' from end of string`
			`return csv`
Read into pandas dataframe to compute consumed energy 2024-02-16 15:01:28 +00:00
			`def energy_total(self):`
			`energy = None`
			`if hasattr(self, "by_node"):`
			`energy = self.by_node.apply(self.energy_node).sum()`
			`return energy`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00
Read into pandas dataframe to compute consumed energy 2024-02-16 15:01:28 +00:00			`@staticmethod`
			`def energy_node(group):`
			`"""Left-sided Riemann sum is enough, as time is lower bound of bucket"""`
			`delta_t = group["time"].diff().shift(-1)/1000. # in seconds`
Refactor class Power to use pandas dataframes 2024-02-20 13:21:12 +00:00			`pow = group['power']`
Read into pandas dataframe to compute consumed energy 2024-02-16 15:01:28 +00:00			`return (delta_t * pow).iloc[:-1].sum()`

			`def summarize_energy(self):`
			`return "# Total energy consumed by job: {energy:.0f} J\n".format(energy=self.energy_total())`

Refactor pretty_print to outine to_csv 2024-02-20 15:49:32 +00:00			`@staticmethod`
Use variable-length method arguments for convenience 2024-02-21 13:41:19 +00:00			`def to_csv(*args):`
Refactor pretty_print to outine to_csv 2024-02-20 15:49:32 +00:00			`return ",".join(str(a) for a in args)`

Add prototype to query job power from database 2023-10-26 14:19:16 +00:00			`@staticmethod`
Use variable-length method arguments for convenience 2024-02-21 13:41:19 +00:00			`def pretty_print(*args):`
			`return Power.to_csv(*args) + '\n'`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00
			`def filename(self, jobid):`
			`fname = "detailed_power_{jobid}.hawk-pbs5.{first}-{last}.csv".format(`
			`jobid=jobid, first=self.first_ts, last=self.last_ts`
			`)`
			`return fname`

Remove debug output and fix whitespace 2023-11-22 09:57:11 +00:00
Introduce class for database handling 2023-11-20 15:21:54 +00:00			`class MonitoringDB:`
Outline query string as class constant 2024-02-06 08:04:52 +00:00			`QUERY_STRING_HAWK = """`
Replace explicit query string with function in TimescaleDB 2024-02-07 13:28:57 +00:00			`-- For description of get_job_data(), see https://kb.hlrs.de/monitoring/index.php/TimescaleDB_-_Query_Guidelines#Function:_get_job_data_and_get_ai_job_data`
			`select * from get_job_data(`
			`'{jobid}.hawk-pbs5',`
			`'cmc_power_racktraynodepoweravg', -- power data source`
			`'{interval} seconds',`
			`array['avg'], -- aggregation: average across samples in bucket`
			`array['time','node'] -- sort by time first than node (ascending)`
Update query string re new naming of tables 2024-01-26 10:35:44 +00:00			`)`
Replace explicit query string with function in TimescaleDB 2024-02-07 13:28:57 +00:00			`as t(time bigint, name varchar, avg double precision);`
Add query and warnings for hawk-ai jobs 2024-02-07 14:54:13 +00:00			`"""`

			`QUERY_STRING_HAWK_AI = """`
			`-- For description of get_ai_job_data(), see https://kb.hlrs.de/monitoring/index.php/TimescaleDB_-_Query_Guidelines#Function:_get_job_data_and_get_ai_job_data`
			`select * from get_ai_job_data(`
			`'{jobid}.hawk-pbs5',`
			`'telegraf_ipmi_power_meter', -- power data source`
			`'{interval} seconds',`
			`array['avg'], -- aggregation: average across samples in bucket`
			`array['time','node'] -- sort by time first than node (ascending)`
			`)`
			`as t(time bigint, name varchar, avg double precision);`
Replace explicit query string with function in TimescaleDB 2024-02-07 13:28:57 +00:00			`"""`

Outline query string as class constant 2024-02-06 08:04:52 +00:00			`def __init__(self, verbose):`
			`self.connection = self.init_db(verbose)`

			`@staticmethod`
			`def init_db(verbose):`
			`import sqlalchemy as db`
			`engine = db.create_engine('postgresql://hpc@hawk-monitor4:5432/coe_mon', echo=verbose)`
			`connection = engine.connect()`
			`return connection`

			`def close_db(self):`
			`return self.connection.close()`

			`@classmethod`
Add query and warnings for hawk-ai jobs 2024-02-07 14:54:13 +00:00			`def build_query(cls, jobid, interval, hawk_ai):`
Outline query string as class constant 2024-02-06 08:04:52 +00:00			`import sqlalchemy as db`
Add query and warnings for hawk-ai jobs 2024-02-07 14:54:13 +00:00			`if hawk_ai:`
			`query_string = cls.QUERY_STRING_HAWK_AI`
			`else:`
			`query_string = cls.QUERY_STRING_HAWK`
Introduce class for database handling 2023-11-20 15:21:54 +00:00			`return db.text(query_string.format(jobid=jobid, interval=interval))`

Add query and warnings for hawk-ai jobs 2024-02-07 14:54:13 +00:00			`def db_to_list(self, jobid, interval, hawk_ai):`
			`query = self.build_query(jobid, interval, hawk_ai)`
Refactor database class for multiple querries 2023-11-20 15:50:22 +00:00			`return self.connection.execute(query).fetchall()`
Introduce class for database handling 2023-11-20 15:21:54 +00:00
Fix various broken symbols 2024-02-07 15:03:39 +00:00			`def db_to_pf(self, jobid, interval, hawk_ai):`
			`import pandas as pd`
Add query and warnings for hawk-ai jobs 2024-02-07 14:54:13 +00:00			`query = self.build_query(jobid, interval, hawk_ai)`
Refactor database class for multiple querries 2023-11-20 15:50:22 +00:00			`return pd.read_sql(query, con=self.connection)`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00
Remove debug output and fix whitespace 2023-11-22 09:57:11 +00:00
Outline main into class 2023-11-22 09:30:36 +00:00			`class App:`
			`def __init__(self, config):`
			`self.config = config`
			`self.db = MonitoringDB(self.config.verbose)`

Warn if interval is short 2024-02-07 13:06:53 +00:00			`@staticmethod`
			`def warnings(config):`
			`warn = ""`
Add query and warnings for hawk-ai jobs 2024-02-07 14:54:13 +00:00			`if not config.hawk_ai and config.interval < 5:`
Warn if interval is short 2024-02-07 13:06:53 +00:00			`warn += '# Warning: interval<5 is very small and may lead to data gaps.'`
Add query and warnings for hawk-ai jobs 2024-02-07 14:54:13 +00:00			`if config.hawk_ai and config.interval < 60:`
			`warn += '# Warning: interval<60 is very small for Hawk-AI nodes and may lead to data gaps.'`
Warn if interval is short 2024-02-07 13:06:53 +00:00			`return warn`

Outline main into class 2023-11-22 09:30:36 +00:00			`def run_all(self):`
Warn if interval is short 2024-02-07 13:06:53 +00:00			`warnings = self.warnings(self.config)`
			`if warnings:`
			`print(warnings)`

Fix namespace bug 2024-02-16 14:59:15 +00:00			`header = f"# {self.config.datetime}: {self.config.cmd}\n"`
Warn if interval is short 2024-02-07 13:06:53 +00:00			`if warnings:`
			`header += f"{warnings}\n"`
			`header += "#\n"`

Outline main into class 2023-11-22 09:30:36 +00:00			`for jobid in self.config.jobid:`
Error handling for jobid without data 2023-11-22 09:52:49 +00:00			`try:`
Add query and warnings for hawk-ai jobs 2024-02-07 14:54:13 +00:00			`power = Power.from_db(self.db, jobid, self.config.interval, self.config.hawk_ai)`
Error handling for jobid without data 2023-11-22 09:52:49 +00:00			`except RuntimeError:`
			`print('No data found for job ID "{}"'.format(jobid))`
			`continue`
Remove debug output and fix whitespace 2023-11-22 09:57:11 +00:00
Log command line in output files 2024-02-07 10:31:30 +00:00			`fn = power.to_file(jobid, header)`
Outline main into class 2023-11-22 09:30:36 +00:00			`if fn:`
			`print('Created file {fn}'.format(fn=fn))`
Save warnings in output 2024-02-15 09:29:45 +00:00			`if power.warnings:`
			`print(power.warnings)`
Read into pandas dataframe to compute consumed energy 2024-02-16 15:01:28 +00:00			`if power.energy:`
			`print(power.energy)`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00
			`if __name__ == "__main__":`
Decouple argument parser from sys.argv 2023-11-22 13:35:19 +00:00			`import sys`
Log command line in output files 2024-02-07 10:31:30 +00:00			`from datetime import datetime`
Decouple argument parser from sys.argv 2023-11-22 13:35:19 +00:00			`config = parse_arguments(sys.argv[1:])`
Log command line in output files 2024-02-07 10:31:30 +00:00			`config.cmd = " ".join(sys.argv)`
			`config.datetime = f"{datetime.now()}"`
Add argument parser 2023-11-17 15:25:51 +00:00
Outline main into class 2023-11-22 09:30:36 +00:00			`main = App(config)`
			`main.run_all()`
Add prototype to query job power from database 2023-10-26 14:19:16 +00:00