dodona-edu / universal-judge Goto Github PK

Universal judge for educational software testing

Home Page: https://docs.dodona.be/en/tested

License: MIT License

Python 80.58% Shell 0.11% Java 2.50% JavaScript 1.12% Haskell 9.44% C 1.63% Kotlin 1.94% C# 1.81% Smalltalk 0.01% Nix 0.53% Jinja 0.34%

dodona educational-software judge

universal-judge's Issues

Add Kotlin as new programming language

demo uitwerken

Oefening: https://github.ugent.be/pythia/programmeren/tree/master/opgaven/reeks08/lotto

Soorten oefeningen die ondersteund worden

In hoofdstuk drie worden voorbeelden gegeven van soorten oefeningen die ondersteund worden door de generieke judge. Daar is op dit moment sprake van drie soorten oefeningen die zullen besproken worden, maar misschien zijn er nog extra waarvan we een voorbeeld zouden willen geven:

batch uitvoer: enkel uitvoeren van ingediende oplossing, zonder bijkomende testgevallen
- lezen van stdin en schrijven naar stdout: dit is het makkelijkste soort oefeningen om een generieke uitvoer voor te voorzien, maar we mogen zeker niet vergeten melden dat de generieke judge dit ook ondersteunt (eerste vier reeksen van Python oefeningen gebruiken dit)
- opties en argumenten doorgeven: wordt gebruikt bij bash shell scripts in computergebruik
- aanvullen van gegeven stuk command line: hierbij is het de bedoeling om een gegeven stuk commandolijn aan te vullen (wordt gebruikt om te leren werken op de commandolijn in computergebruik); bijvoorbeeld vul aan zodat omgekeerde string wordt teruggegeven echo 'SPAM' | ... (moet bv. MAPS uitschrijven op stdout; testgevallen bestaan telkens uit stuk commandolijn met lichte varianten, hier de string die uitgeschreven wordt op stdin, waar de ingediende oplossing dan moet ingevuld worden op de plaats van de drie puntjes)

Real world test beschrijven

Vergeet je ook niet ergens ruimte te voorzien om de real world test van je judge op Dodona te bespreken. Je hoeft dit nu nog niet per se uit te schrijven (we hebben een beoordeling op de GitHub issue), maar ergens een stub voorzien dat het niet vergeten wordt, kan geen kwaad.

Time-outs beschrijving

Eventueel bij robuustheid
Bij future work: de huidige implementatie is zoals beslist niet echt geavanceerd. Er wordt bijvoorbeeld geen verschil gemaakt tussen batchcompilatie en contextcompilatie, terwijl in dat laatste geval 20% van de uitvoeringstijd waarschijnlijk niet volstaat voor het compileren (en de judge dus nog steeds gekilled zal worden door Dodona)

Introduceer expressions & assignments in minimale vorm

In de nota's op de tekst staat een boomstructuur dat een goed begin is. Daarvan verder werken zou wel enkel voordelen opleveren:

De omslachtige manier van literals te gebruiken bij function calls wordt opgelost (de speciale "identity" function mag weg)
Beperkingen bij function calls wordt opgelost

Concreet zou het gaan om:

Hernoem assignment naar statement (in TESTed is het enige soort statement een assignment, ik zou expressions geen statements maken op dit moment)
Voer expressions in, die bestaan uit:
- Literals
- Identifiers
- Function calls
Bij een function call worden de parameters een expression
De expressions hebben op dit moment geen operators, we willen geen programmeertaal maken

Dit zou het ook gemakkelijker maken om ooit uit te breiden naar een meer volledige AST, maar dat is momenteel niet de bedoeling van deze issue.

Uitbreiden gegevenstypes

Het idee is om de gegevenstypes op te delen in twee categorieën:

De basistypes, met de huidige types (integer, rational, text, boolean, sequence, set en map.
Uitgebreide types. Deze gegevenstypes staan toe om meer details te gebruiken.
Het grote verschil is dat deze uitgebreide types standaard vertaald worden naar een van de basistypes. Voor talen die bijvoorbeeld geen tuple uit Python ondersteunen, zal het vanzelf omgezet worden naar een list (maar bv. in Haskell kan het wel omgezet worden naar een tuple). Er is ook de mogelijk dat implementaties voor programmeertalen expliciet een bepaald type niet ondersteunen. Zo zal de Java-implementatie geen uint64 (een unsigned 64-bit integer) ondersteunen, omdat er geen equivalent bestaat in de taal. Een voorbeeld:

TESTed ->	`int8`	`uint8`	`int16`	`uint16`	`int32`	`uint32`	`int64`	`uint64`
Python	`int`	`int`	`int`	`int`	`int`	`int`	`int`	`int`
Java	`byte`	`short`	`short`	`int`	`int`	`long`	`long`	-
C	`int8_t`	`uint8_t`	`int16_t`	`uint16_t`	`int32_t`	`uint32_t`	`int64_t`	`uint64_t`
Haskell	`Integer`	`Integer`	`Integer`	`Integer`	`Integer`	`Integer`	`Integer`	`Integer`

Het grote voordeel is dat er meer types kunnen, zoals bv. list en tuple in Python, maar ook array en List in Java.

taalspecifieke evaluators

Uitgevoerd aan de kant van de studentencode
Wat schrijven we naar de judge (en hoe)?
- Ofwel een eigen formaat
- Ofwel direct het Dodona-formaat

In beide gevallen misschien een soort functie voorzien zodat niet elke evaluator dit moet implementeren.

Eigen formaat

Potentieel eenvoudiger: bv. enkel accepted en een tekstuele diff.
Potentieel duplicaat van Dodona-formaat: misschien willen we ook messages enzo.

Dodona-formaat

Omgekeerde van eigen formaat

Sowieso in beide gevallen strikte controle in de judge voor we het doorsturen naar Dodona.

Exitcode enkel in main testcase

Momenteel heb ik de exitcode toegevoegd zoals andere "channels" (stdout, stderr, ...) aan een testcase. Dit is niet helemaal juist: er namelijk slechts één exitcode per context. Potentieel is er dus een probleem, waarbij verschillende testcases binnen één context andere exitcodes verwachten, wat dus nooit gaat werken.

Idee: move to main testcase:

Er is maar één main testcase per context
Houdt semantisch steek: de main testcase wordt ook al gebruikt voor de main-functie of voor scripts.

Minder kopieën van evaluators

Het enige dat verschilt is eigenlijk evaluator_executor, dus zou dit gemakkelijk in dezelfde map kunnen.

Constructors in Haskell

Vervolg van #11. De vertaling naar Haskell is niet altijd triviaal. Verdergaan op het voorbeeld, stel dat de Tree een functie right heeft:

public class Tree<T> {
    public Tree<T> right() {
        return this.r;
   }
}

In het testplan zou dit opgesteld worden als twee testcases:

Tree<?> tree = new Tree<>();
assert tree.right() == null;

In Haskell veronderstel ik dat hetzelfde implementeren iets zal worden als:

data Tree a = Parent (Tree a) (Tree a)
            | Leaf


right :: Tree a -> Maybe (Tree a)
right (Parent l r) = Just r
right Leaf = Nothing

In dit geval zijn er ook twee testcases:

t = Parent Leaf Leaf
assert (right t) == Just Leaf

Vragen voor later of tijdens een vergadering:
Willen we dit soort vertaling doen in de judge? Hoever willen we daar in gaan? Welke paradigma willen we ondersteunen? (Misschien is het ook eens de moeite om naar enkele oefeningen te kijken die Haskell gebruiken, om te zien wat er juist nodig is)

Monitor bestanden aanmaken

Er zal wel een mogelijkheid bestaan om te weten welke bestanden aangemaakt zijn door een proces.
Dit zou kunnen gebruikt worden om de "file channel" te verbeteren met de mogelijkheid om het maken van bestanden als fout te rekenen.

Linting toevoegen aan programmeertalen

Python ondersteunt al pylint. Voor Javascript kunnen we eslint toevoegen (zit uitgecommentarieerd ook al in de JavaScript judge).

Zijn er ook (aanbevolen) linkers voor Java en Haskell? (@ninewise)

diavoorstelling tussentijdse presentatie

robuuste judge

De judge liefst met alle mogelijke manieren waarop het verkeerd kan gaan overweg kunnen. Doelen, in volgorde van belangrijkheid:

De judge mag nooit foute output juist rekenen.
Zoveel mogelijk nuttige uitvoer geven.

Waar is de judge op voorzien:

Moeilijker:

Tijdslimiet
Geheugenlimiet
Uitvoerlimiet (bv. echt heel veel blijven printen in oneindige lus)

Gemigreerd van https://github.com/niknetniko/test-judge/issues/2

Parallelle uitvoering verwijderen uit tekst

Ik heb de parallelle uitvoering van de contexten verwijderd voor het implementeren van de time-out.

De globale timer maakt het ingewikkeld om een juiste time-out toe te passen. Bovendien zullen de resultaten dan minder betrouwbaar zijn: bij oefeningen met een strakke tijdslimiet kan het zijn dat een beoordeling slaagt bij een uitvoering (omdat er parallel contexten uitgevoerd worden), maar faalt bij een andere, doordat de contexten sequentieel te traag zijn. Ik zie hier niet direct een oplossing voor.
De tijdswinst op Dodona zelf is niet zo groot (zoals al vermeld in de tekst).

Concreet zou ik overal de vermelding van parallelle uitvoering verwijderden, met uitzondering van de paragraaf over performantie, waar ik bovenstaande uitleg kan doen.

taalspecifieke invoer

Een stuk code dat uitgevoerd wordt als "functie-oproep". Eventueel, maar niet noodzakelijk, gekoppeld aan taalspecifieke evaluator (#3)

Te doen:

Welke combinaties zijn mogelijk? Bv. stdin en eigen code, generieke functie en eigen code, enz. In welke volgorde moeten dingen?

Denken over parallelle uitvoering en time-outs

Bij de parallelle uitvoering zijn twee problemen die ik momenteel zie:

Een globale counter werkt niet bij als er meerdere contexten in parallelle uitgevoerd worden, of toch op een andere manier dan als ze niet in parallel uitgevoerd worden. Dit maakt het ook moeilijker om een deftige timeout in te stellen voor een oefening, want je weet niet hoeveel cores er vrij zijn in Dodona als de uitvoering gebeurt.
Door de parallelle uitvoering kunnen resultaten pas verwerkt worden na de uitvoeringen (wat nu gebeurt) of er zou een soort worker thread moeten zijn die een queue bijhoudt van verwerkte oefeningen om ze in volgorde en sequentieel te verwerken, maar dat is redelijk wat implementatiewerk, en nog de vraag hoe goed dat werkt met de global interpreter lock enzo.

Dat laatste is een probleem als we ooit toch op Dodona willen overschakelen voor time-outs (stel dat er een modus komt om geplande testen eerst aan te geven, zoals Peter zei).

Een mogelijkheid is geen parallelle uitvoering meer doen; dat is wel jammer omdat de contexten zelf onafhankelijk zijn, maar anderzijds is de snelheidswinst beperkt of onduidelijk (op de workers van dodona in elk geval).

[Tekst] Vreemde ligaturen uitzetten

Het lettertype voorziet een ligatuur voor tz:

Zoek een manier om dit uit te zetten. Overige ligaturen mogen aan blijven, want die zijn veel subtieler.

Research PEML

Research how we can use PEML as DSL to write exercises

Research PEML
Integration with Tested

Shebang voor programmeertaalkeuze

Inspiratie op https://en.wikipedia.org/wiki/Shebang_(Unix), leuk voor de demo.

Syntaxis:

#!tested [programmeertaal]

performantie verbeteren

Enkele ideeën:

Contexten parallel uitvoeren
Bijkomende compilatiestap voor dingen die niet context-afhankelijk zijn, zoals de code van de student.

aantekeningen vergadering VIII

Voorbereiding

De voorbije week

Termen:

Aangepaste (custom) evaluator: eigen evaluatiecode, maar taalonafhankelijk
Specifieke (specific) evaluator: eigen evaluatiecode, taalafhankelijk

Gedaan deze week:

Implementeer eigen taalonafhankelijke evaluatiecode
Implementeer exception als eigen kanaal
- Laat ook aangepaste en specifieke evaluators toe, die krijgen dan de exception
- Geïmplementeerd in Java en Python: niet helemaal duidelijk of dat dat bestaat in Haskell
- Werkt als het foutkanaal: indien het testplan none specificeert, d.w.z. er geen uitvoer op het exceptions-kanaal verwacht wordt, zal de uitvoer van het kanaal gebruikt worden als foutboodschap van de andere kanalen
Werk implementatie serialisatie af (voornamelijk in Haskell)
Kijk wat naar oefeningen van Veerle
- Op zich redelijke kandidaat voor het tonen van wat we willen oplossen (zelfde oefening in andere talen)
- Wel nog geen fantastische kandidaat gevonden voor aangepaste evaluator

Volgende week

Opstellen van een oefening met "willekeurigheid", kan de aangepaste evaluator tonen
Beginnen aan opstellen diavoorstelling
Implementeren polling voor bestandsgrootte
Implementeren taalspecifieke invoer
Nadenken en eventueel implementeren constructor calls

constructor calls

Dit zou leuk zijn om ook te hebben in het generieke deel, maar:

Wat gebeurt er met talen waar dit helemaal anders is (bv. Haskell)

Zie ook #10.

oefening kiezen voor tussentijdse presentatie

Er zijn drie soorten oefeningen:

Invoer-uitvoeroefeningen
Oefeningen met eigen evaluatiecode (maar toch taalonafhankelijk)
Oefeningen met taalspecifieke dingen

Echter:

De eerste soort kan wel getoond worden, maar toont de sterkte van de judge nog niet helemaal: uiteindelijk kan dat ook door gewoon de code uit te voeren (en volstaat een afbeelding van de taal naar een uitvoercommando).
Bij de laatste soort is uiteraard zo dat dit niet veel verschilt van de huidige werkwijze, aangezien het maar voor 1 taal is.
Ik denk dat de tweede soort oefening de opzet van de thesis het best toont, en ook verklaart waarom er een hele judge rond gebouwd wordt.

Uiteraard kunnen de drie modi vermeld worden, maar ik zou aan de hand van het tweede soort oefening uitleggen hoe alles werkt.

Zoals besproken tijdens de meeting:

Mogelijke oefeningen zijn misschien te vinden in de cursus(sen) van Veerle Fack.
Anders een eenvoudige oefening met willekeurigheid

generieke functie-oproep

Op dit moment heeft de functie-oproep volgende data:

type: het soort functie-oproep, zie hieronder
name: de naam van de functie
object: (optioneel) waarop de functie opgeroepen wordt
arguments: lijst van waarden, in het serialisatieformaat

Er zijn momenteel twee soorten functies:

top: top-level functies
object: functies die op een object opgeroepen worden, bv. een klasse of instantie

Niet elke taal ondersteunt top-level functies (bv. Java). Bij dergelijke talen worden top-leven functies omgezet naar object-functies, met als object het object waarin de ingediende code zich bevindt, om een zo goed mogelijke benadering te maken.

Een voorbeeld schept klaarheid:

Code van de student: in Main.java zit een klasse Main, voor Python zit de code in submission.py.
In het testplan zit een top-level functie-oproep: max(5, 10).

Dit testplan in Python zou gewoon een oproep genereren voor een functie max in submission.py. In het geval van Java zal een oproep gegenereerd worden voor een statische functie op de klasse van de ingediende code: Main.max.

Zoals in de rest van de judge is er geen ondersteuning voor andere niveau's van indeling, zoals Java-packages of -modules, Haskell-modules, enz.

Te doen:

Omzetten naar taalspecifieke conventies, zoals CamelCase en snake_case.
Betere ondersteuning voor functies zonder return-waarde. Dit zou nu misschien ook werken, maar niet in alle talen (bv. Haskell).
- Moet dit gecontroleerd kunnen worden? M.a.w. is het dan verkeerd als de functie toch iets teruggeeft? Indien wel is dit moeilijker te doen, maar zou wel het meest flexibel zijn.

Misschien te doen:

Zou er ergens ondersteuning moeten zijn voor constructor calls? Dit zou dan een functie-oproep zijn zonder return-waarde. Op zich nuttig om functies op instanties op te roepen. Eens functies zonder return-waarde er zijn, is dit niet meer zoveel werk.
- Implementeren als functie, zoals hierboven gezegd, of meer als een soort statement dat voor de testcase uitgevoerd wordt, waarvan de evaluatie er ook mee samenhangt (i.e. dan wordt er geen separator geschreven tussen de twee zaken).

In vroegere versies van de code bevatte het functie-oproep mechanisme een main-type alsook een onderscheid tussen static en niet-statische functies.

Het type main is verwijderd omdat de toegevoegde complexiteit niet opwoog tegen de voordelen. Main-functies worden nu volledig apart behandeld in de sjablonen.

Het onderscheid tussen statische en niet-statische functies is verwijderd omdat het niet nuttig was; dit onderscheid kan nog steeds gebeuren door het attribuut object juist in te stellen.

Partiële evaluaties met orakel

Uit de e-mail:

Een speciaal geval is van geprogrammeerde evaluatie, die je een "orakel" zou kunnen noemen.
Voorbeeld: oefening waarbij de leeftijd van een persoon moet berekend worden (op vandaag), gegeven de geboortedatum van die persoon. Daarbij kan dus de verwachte waarde niet statisch in het testplan zitten, maar het kan wel berekend worden door een orakel. Dit orakel kan nu al vervat zitten in de geprogrammeerde evaluatie, maar het zou eventueel ook kunnen:

berekend worden in het testplan (dynamisch testplan), dus voorafgaand aan het genereren van de testcode

berekend worden door het orakel en geëvalueerd worden door TESTed als het resultaat een ondersteund datatype heeft (zoals in dit geval een integer); met andere woorden, de geprogrammeerde evaluatie bestaat er dan enkel in om op basis van de input (geboortedatum) de verwachte output (leeftijd) te genereren en die terug te geven aan TESTed, die dan op zijn beurt de gelijkheid van de verwachte waarde (gegenereerd door het orakel) en de gegenereerde waarde (door de ingediende oplossing) kan controleren

In die zin werkt het "orakel" eerder op dezelfde manier als de uitvoeringsomgeving, dan als de evaluatieomgeving, want ze moet enkel resultaten afleveren (hetzij voor integratie in het testplan of voor gebruik in de evaluatiestap van TESTed). Voor wie het testplan opstelt, zou dat betekenen dat een (deel van een) voorbeeldoplossing moet aangeleverd worden (in een programmeertaal die door TESTed ondersteund wordt.

Oefening: ISBN

Implementeer testplan
Test met bestaande implementaties
Docker image in Dodona
Judge in Dodona
#16: channel aan output toevoegen, misschien iets als niknetniko/dodona@07eb031

Message format bij evaluators

Momenteel is dat enkel tekst, maar het kan handig zijn om ook het formaat (en als we toch bezig zijn ook de zichtbaarheid) te kunnen opgeven: op dat moment kunnen we zelfs het formaat van Dodona gewoon gebruiken.

aangepaste doch taalonafhankelijke evaluatoren

Zal op een zeer gelijkaardige manier werken als de taalspecifieke evaluatoren, behalve dat hier dezelfde code voor alle talen wordt gebruikt.

Bij de taalspecifieke evaluatoren wordt de waarde rechtstreeks aan de evaluatiefunctie gegeven, die uitgevoerd wordt in de context van de studentcode.

Hier zal de waarde geserialiseerd worden, en via de judge naar de evaluatiecode gestuurd worden. Deze laatste evaluatiecode voert niet uit in de context van de studentcode. De judge zal ook de waarde deserialiseren naar objecten in de taal van de evaluator.

indent multiline code in templates

See https://groups.google.com/forum/#!topic/mako-discuss/OiruSMSyrVw

Optional context / testcase

An optional context or testcase that uses a construct not supported by the programming language of the submitted solution would be skipped, instead of flagging a no-language-support for the entire testplan.

Verwerk nota's Charlotte

exceptions als apart kanaal

Het valt te overwegen om exceptions als apart kanaal te voorzien, om bv. te controleren dat stuk code de juiste exception smijt.

Te bepalen:

Kan dit generiek? I.e. voorzien we een reeks standaardexceptions (bv. IndexOutOfBounds, ...) Of is dit taalspecifiek?
In elk geval: welk formaat?
Voorzien we fallback voor talen die niet gedefinieerd zijn? Als een functie bv. een exception moet gooien bij foute invoer, zouden we kunnen verifiëren dat er iets is op stderr als we geen exception hebben gedefinieerd voor de taal.

Update aan nieuwe implementatie

Met #20 moet nagekeken worden of de beschrijving van de evaluatie van de testcases nog in orde is.
Beschrijf toestand na #26.
Het ziet er naar uit dat de implementatie van #24 net iets anders gaat zijn dan wat de tekst beschrijft, pas de tekst lichtjes aan.

Controle op onoplosbare oefeningen

Momenteel beperkt de controle op comptabiliteit met een programmeertaal tot dingen die TESTed nodig heeft (een testplan waarbij bv. sets gebruikt worden zal niet werken in talen zonder set).

Er is nog een ander aspect dat niet gecontroleerd wordt: is de oefening oplosbaar in de programmeertaal. Bij de ISBN-opgave bijvoorbeeld:

Schrijf een functie is_isbn waaraan een string c (str) moet doorgegeven worden. De functie moet een Booleaanse waarde (bool) teruggeven, die aangeeft of c een geldige ISBN-code is. De functie heeft ook nog een optionele tweede parameter isbn13 waaraan een Booleaanse waarde (bool) kan doorgegeven worden die aangeeft of het om een ISBN-10 code (False) of om een ISBN-13 code (True, standaardwaarde) moet gaan.

Deze opgave impliceert dat er een manier is om optionele parameters te hebben in de taal. In Java is dit opgevangen met overloading, maar dat is niet mogelijk in alle talen. In C zou er rond gewerkt kunnen worden met een macro (denk ik, nog niet gedaan), maar ik heb nog niet echt een goede oplossing gevonden voor Haskell.

Hier zijn meerdere pistes mogelijk:

We doen niets. Het is dan aan de lesgever om aan te duiden welke programmeertalen mogelijk zijn.
We leiden een soort van function signatures af uit de oproepen in het testplan, en controleren vervolgens of de taal dat ondersteunt (of we eisen dat deze signatures ook in het testplan zijn, maar dat gaat is minder eenvoudig)
We doen ook geval 2, maar proberen dan de compiler of runtime errors te parsen en zo te bekijken of de functie juist is of niet (bv. in haskell zal dit een compiler error zijn). Dit moet dan wel zeer strikt zijn, zodat errors door slechte code van de studenten niet ook goedgekeurd wordt.

Een ander, gerelateerd aspect zijn dynamische types van argumenten. In Python geen probleem, Java ook nog doenbaar met overloading, maar Haskell en C worden weer moeilijk.

Niet-uitgevoerde testgevallen tonen

Zie #20.

Explicit newline trimming

When comparing file content line by line, trailing newlines are trimmed by default.

Another option would be not to trim these newlines automatically (.splitlines(True)) and add an explicit option for trailing newline trimming (one? multiple?) to textual comparisons. This way, we leave full freedom in testing whether or not the last line of a text file should end with a newline. This is impossible if newlines are trimmed upfront.

Voeg data en "channel" toe aan partieel outputformaat

Voor ik een PR maak op Dodona nog een vraag: momenteel (lokaal) zit dat zo in het formaat:

"close-test": {
        "type": "object",
        "description": "Close the current test. Accepted iff status is correct, but you can overwrite this.",
        "required": ["command", "status", "generated"],
        "properties": {
            "command":   { "enum": ["close-test"] },
            "generated": { "type": "string" },
            "accepted":  { "type": "boolean" },
            "status":    { "$ref": "#/definitions/status" },
            "data":      { "type":  "object" } // <---- HIER
        }
    }

De vraag is of het veldje data "getypeerd" moet worden, of mag dat gewoon een object zijn zoals nu? Indien het een schema moet krijgen, wat mag er dan in zitten?

Implementeer geheugenlimiet

Ook iets als 80% van het totaal voor het subproces.

Harmoniseer bestandsnamen

Soms wordt de secret als suffix gebruikt, soms als prefix.

formaat voor serialiseren bepalen

Enkele pointers van prof. Dawyndt:

some related terms

serialization

language-independent specification

language interoperability

transpiler

foreign function interface

calling convention

service-oriented architecture (SOA)

interface description language (IDL)

Apache Thrift

Apache Avro

Protocol Buffers

FlatBuffers

Common Object Request Broker Architecture (CORBA)

comparison of data serialization formats

Vereisten:

Makkelijk uitbreidbaar naar andere programmeertalen
Eventueel ook uitbreidbaar in de types
Ondersteunen wat wij willen

Te doen:

Lijst opstellen van types die we willen (int, float, double, lijst, boolean, enz.)

Time-outs implementeren

Per context
Standaardwaarde: 80% van totaal / aantal contexten
Standaardwaarde overschrijven op niveau van context
- Per programmeertaal andere waarde mogelijk

Escape double quotes in string literal

The reason I initially took the easy road here by adopting the Python single quote default for string literals, is that there's an extra step needed to escape double quotes inside a string literal enclosed in double quotes. I think this still needs to be done here, by replacing any double quote by an escaped double quote, unless it's already escaped.

universal-judge/judge/src/tested/languages/javascript/templates/value_basic.mako

Line 7 in 27bd342

"${value.data}"\

Toekomstig werk

Ik begin met de hoofdstuk 5 van de thesis te lezen, en wil graag een overzicht maken van "ontbrekende features die we halen uit analyse van bestaande judges" en "ontbrekende features om meertalige oefeningen te ondersteunen in Dodona". Voor mij ligt nu nog niet vast of dit uiteindelijk nog in hoofdstuk 5 moet komen, en ik vraag me op dit moment ook nog niet af of we de features wel willen en of we ze finaal ook moeten implementeren. Is in eerste plaats een boekhouding van ideeën die nog opkomen, en die eventueel kunnen meegenomen worden in een vervolgthesis of bij het verder afwerken van TESTed.

Stub voor linter

De tekst bevat nu nog geen bespreking van de stub die voorzien is om een linter te configureren voor de programmeertaal.

Performantie geprogrammeerde evaluatie

Hier zijn twee ideeën voor:

Gebruikt jupyter kernels. Dit heb ik momenteel opgenomen als future work in de tekst.
Voorzie speciale ondersteuning voor Python door de custom evaluator rechtstreeks uit te voeren, zoals bv. de Python-judge dat doet.
- Hier kan zelfs verder in gegaan worden: we zouden kunnen zeggen dat geprogrammeerde evaluatie enkel in Python mogelijk is. Dit heeft bijkomende voordelen:
  - De geprogrammeerde evaluatie moet niet in de programmeertaal geïmplementeerd worden (ik kijk er sowieso voor om dit optioneel te maken)
  - We zijn niet meer gebonden aan de serialisatie voor de communicatie custom evaluator <-> judge. Het meegeven van bv. de context uit het testplan aan de evaluator is dan perfect mogelijk.
  - Implementatie TESTed wordt eenvoudiger.

Vergadering XIII

Gedaan

Implementatie assignments
- In de vorm naam = functieoproep
- Functieoproep uitgebreid met constructor-type en identity-type
  - Constructor: speciaal geval voor constructor
  - Identity: Letterlijk het argument, laat waarden of vroeger toegekende variabelen toe
- Type van assignment is instelbaar, maar bv. voor identity wordt het afgeleid
- Constructors nog niet in Haskell, zie #17
  - Willen we dingen vertalen naar Haskell? Indien wel, hoever willen we daarin gaan? Wat is de "manier" om het in the testplan te doen?
- Wat met speciale ingebouwde functies? Bv. str() (en repr?) of len()?
Specificatie van vereiste functies

Mee bezig

Refactoren en herschrijven voor idee voor performance

serialisatieformaat opstellen

Zie #8 voor een lijst van ondersteunde datatypes. Om de implementatie eenvoudiger te houden, is het best om onmiddellijk voor alle types het type ook apart mee te geven, los van hoe we het in json implementeren (bv. ook bij strings al het type string meegeven).

Default parameters

Ik zou de term "default arguments" hernoemen naar "default parameters". Dan is ook het verschil met "named arguments" duidelijker en wordt ook de meer gangbare terminologie gebruikt.

De term parameter wordt gebruikt voor een (abstracte) invoerkanaal waarop informatie aan een functie/methode kan doorgegeven. Dit wordt vastgelegd bij het definiëren van de functie/methode. Bij de definitie kan er ook een standaardwaarde gekoppeld worden aan het invoerkanaal, en daarom noemen we het een "default parameter".

Bij het aanroepen van een functie kan aan elk invoerkanaal een waarde doorgegeven worden. Die waarde noemen we een argument. De koppeling tussen de argumenten en de parameters kan positioneel of benoemd zijn. We spreken in dat laatste geval van named arguments (benoemde argumenten) of keyword arguments.

dodona-edu / universal-judge Goto Github PK

universal-judge's Issues

Eigen formaat

Dodona-formaat

Voorbereiding

De voorbije week

Volgende week

Recommend Projects

Recommend Topics

Recommend Org